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读者 评论 


我 觉得 你 的 文章 跟 一 般 Java 教 程 最 大 的 不 同 在 于 ， 你 把 各 个 知识 点 
的 “为 什么 ”都 解释 得 很 清楚 ， 非 常 对 味 ， 非 常 感谢 。 很 多 网 上 教程 ， 都 
征 直 接 教 如 何 做 的 ， 主 要 是 动手 能 力 。 可 是 做 完了 还 是 云 里 雾 里 。 结 合 
你 的 文章 ， 一 下 子 就 通 透 了 。 














Hannah 


老 马 说 编程 ， 太 好 了 。 把 神秘 的 编程 ， 通 俗 地 讲解 ， 使 编程 者 认识 
了 本 质 。 每 个 专题 的 介绍 都 是 深入 浅 出 ， 有 分 析 ， 有 总 结 ， 有 详细 例 
子 ， 真 是 爱不释手 的 宝 书 。 


一 一 张 工 荣成 


其 实 老 马 写 的 东西 网 上 都 有 大 把 的 类 似 文章 ， 但 是 老 马 总 是 能 把 复 
杂 的 东西 讲 得 深入 浅 出 ， 把 看 似 简 单 的 东西 分 析 得 细致 深入 ! 





VitaminChen 


文章 比 其 他 文章 的 完 点 : 有 情景 带 入 ， 重 点 突出 ， 让 人 耳目 一 新 ， 
读 起 来 很 方便 。 感 谢 辛 苦 付 出 。 








— hellojd 


里 然 我 使 用 Java 多 年 ， 可 是 阅读 作者 的 文章 仍然 觉得 受益 菲 浅 。 并 
发 总 结 得 很 好 ， 对 前 面 讲 的 并 及 知识 作 了 很 好 的 总 结 和 梳理 。 








我 不 是 初学 者 ， 依 然 能 从 这 里 学 到 很 多 东西 。 对 不 了 解 原理 的 非 初 
学 者 来 次 ， 像 回头 捡 落下 的 宝贝 似 的。 关于 编码 ， 之 前 一 直 云 里 雾 里 
的 ， 找 了 几 篇 文章 都 没 读 进去 。 你 的 讲解 浅显 易 懂 ! 








Keyirei 


用 平实 的 语言 把 计算 机 科学 的 思维 方法 由 浅 入 深 ， 娓 九 道 来 ， 让 人 
如 沐 春 风 ， 酌 酮 灌顶。 这 里 面 没 有 复制 、 粘 贴 的 拼凑 ， 更 没有 生硬 主 怪 


的 翻译 腔 ， 文 草 中 人 句 句 都 能 感觉 到 老 马 理解 、 实 践 、 叶 通 后 表达 出 来 的 
逻辑 严密 周全 和 通 透 流畅 。 
一 一 杜 鹏 





最 近 从 PHP 转 Java， 从 您 的 文章 学 到 了 很 多 知识 ， 很 系统 地 重 构 了 
对 计算 机 以 及 程序 语言 的 认 知 ， 很 感谢 。 
一 一 房 飞 





多 线程 一 直 连 概念 也 模糊 ， 阅 读 后 真 的 受益 匪 浅 ! 异常 处 理 ， 看 着 
简单 ， 刚 开始 学 习 时 ， 和 上 自己 也 是 胡乱 try 和 throw， 不 过 到 开发 时 ， 才 体 
会 到 正确 处 理 的 重要 性 。 感 谢 这 篇 文章 。 比 起 学 习 使 用 庞大 的 框架 ， 我 
觉得 基础 知识 是 更 重要 的 ， 对 于 一 个 知识 点 的 理解 ， 细 细 琢 麻 ， 知 道 实 





现 原理 ， 也 是 一 种 收获 。 
一 -一 Chain 


为 什么 要 写 这 本 书 


写 一 本 关于 编程 的 书 ， 是 我 大 概 15 年 前 就 有 的 一 个 想法 ， 当 时 ， 我 
体会 到 了 编程 中 数据 结构 的 美妙 和 神奇 ， 有 一 种 收获 的 喜悦 和 分 享 的 冲 
动 。 这 种 收获 是 我 反复 阅读 教程 十 几 遇 ， 花 大 量 时 间 上 机 练习 调试 得 到 
的 ， 这 是 一 个 比较 痛苦 的 过 程 。 我 想 ， 如 果 把 我 学 到 的 知识 更 为 清晰 易 
懂 地 表达 出 来 ， 其 他 人 不 就 可 以 掌握 编程 容易 一 些 ， 并 体会 到 那 种 豆 悦 
人 


触发 我 开始 写作 是 在 2016 年 年 初 ， 可 汗 学 院 的 事迹 震撼 了 我 。 可 汗 
学 院 的 创始 人 是 萨 尔 曼 :可 汗 ， 他 目 己 录制 了 3000 多 个 短视 频 ， 主 要 教 
中 小 学 生 基 础 课 。 他 为 每 门 课程 建立 了 知识 地 图 ， 地 图 由 知识 点 组 成 ， 
知识 点 之 间 有 依赖 关系 。 每 个 知识 点 都 有 一 个 视频 ， 每 个 视频 10 分 钟 左 
右 ， 他 的 讲解 清晰 透彻 ， 极 受 欢 迎 。 比 尔 : 盖 菊 声 称 可 汗 是 他 最 欣赏 的 
老师 ， 邀 请 其 在 TED 发 表演 讲 ， 同 时 投资 可 汗 成 立 了 非 营 利 机 构 可 汗 学 
院 ， 可 汗 也 受到 了 来 自 谷 歌 等 公司 的 投资 。 可 以 说 ， 可 汗 以 一 己 之 力 推 
动 了 全 世界 的 教育 。 


我 就 想 ， 我 可 不 可 以 学 习 可 汗 ， 为 计算 机 编程 教育 做 一 点 事情 ? 也 
就 是 说 ， 为 编程 的 核心 知识 建立 知识 地 图 ， 从 最 基础 的 概念 开始 ， 分 解 
为 知识 点 ， 一 个 知识 点 一 个 知识 点 地 讲解 ， 每 一 个 知识 点 都 力争 清晰 透 
彻 ， 阐 述 知 识 点 是 什么 、 怎 么 用 、 有 什么 用 途 、 实 现 原 理 是 什么 、 思 维 
逻辑 是 什么 、 与 其 他 知识 点 有 什么 关系 等 。 可 汗 的 形式 是 视频 ， 但 我 想 
先 从 文字 总 结 开 始 。 我 希望 表达 的 是 编程 的 通用 知识 ， 但 编程 总 要 用 一 
个 具体 语言 ， 我 想 就 用 我 最 熟悉 的 Java 吧 。 


过 去 十 几 年 ，Java 一 直 是 软件 开发 领域 最 主流 的 语言 之 一 ， 在 可 以 
预见 的 未 来 ，Java 还 将 是 最 主流 的 语言 之 一 。 但 关于 Java 编 程 的 书 比比 
峭 是 ， 也 不 乏 经 典 之 作 ， 市 场 还 需要 一 本 关于 Java 编 程 的 书 吗 ? 甚至， 
还 需要 编程 的 书 吗 ? 如 果 需 要 ， 需 要 什么 样 的 书 呢 ? 


关于 编程 的 需求 ， 我 想 答案 是 肯定 的 。 过 去 儿 十 年 ，IT 半 命 深 刻 地 
改变 了 人 们 的 生活 ， 但 这 次 革命 还 远 远 没有 停止 ， 在 可 以 预见 的 未 来 ， 





























人 工 智 能 等 前 沿 技术 必 将 进一步 改变 世界 ， 而 要 掌握 人 工 智能 技术 ， 必 
须 先 掌 握 基 本 编程 技术 。 人 工 智 能 在 我 国 已 经 上 升 为 国家 战略 。2017 年 
7 月 ， 国 务 院 印 发 了 《新 一 代 人 工 乔 能 发 展 规划 》， 其 中 提 到 “实施 全 民 
智能 教育 项 目 ， 在 中 小 学 阶段 设置 人 工 智 能 相关 课程 ， 逐 步 推广 编程 教 
育 ?”， 未 来 ， 可 能 大 部 分 人 都 需要 学 习 编程 。 


关于 编程 的 书 是 很 多 ， 但 对 于 非 计算 机 专业 学 生 而 言 ， 擎 握 编 程 依 
然 是 一 件 困 难 的 事情 。 绝 大 部 分 教程 以 及 培训 班 过 于 奶 求 应 用 ， 读 者 学 
完 之 后 虽然 能 照 大 例子 写 一 些 程 序 ， 但 却 慌 慌 懂 懂 ， 知 其 然而 不 知 其 所 
以 然 ， 无 法 灵活 应 用 ， 当 希望 进一步 深入 学 习 时 ， 发 现 大 部 分 专业 书籍 
临 汲 难 懂 ， 难 以 找到 通俗 易 懂 的 与 学 过 的 应 用 相 结合 的 进 阶 原理 类 书 
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即使 计算 机 专业 的 学 生 ， 学 习 编 程 也 不 容易 。 学 校 开 设 了 很 多 理论 
课程 ， 但 学 习 理 论 的 时 候 往往 感觉 比较 枯燥 ， 比 如 二 进 制 、 编 码 、 数 据 
结构 和 算法 、 设 计 模式 、 操 作 系 统 中 的 线程 和 文件 系统 知识 等 。 而 学 习 
县 体 编程 语言 的 时 候 ， 又 侧重 学 习 的 是 语法 和 API。 学 习 计算 机 理论 的 
重要 目的 是 为 了 更 好 地 编程 ， 但 学 生 却 难以 在 理论 和 编程 之 问 建立 密切 
9 联系 。 


这 样 ， 我 的 想法 基本 就 确定 了 ， 用 Java 语 言 写 一 本 帮助 理解 编程 到 
底 是 怎么 回 事 的 书 ， 尺 量 用 通俗 易 懂 的 方式 循序 渐进 地 介绍 编程 中 的 主 
要 概念 、 语 法 和 类 库 ， 不 仅 介 绍 用 法 和 应 用 ， 还 剖析 背后 的 实现 原理 ， 
以 与 基础 理论 相 结合 ， 同 时 包含 一 些 实用 经 验 和 教训 ， 并 解释 一 些 更 为 
高 层 的 框 采 和 库 的 基本 原理 ， 以 与 实践 应 用 相 结合 ， 在 此 过 程 中 ， 融 合 
编程 的 一 些 通 用 思维 迎 辑 。 


我 有 能 力 写 好 吗 ? 我 并 不 是 编程 大 师 ， 但 我 想 ， 可 汗 也 不 是 每 个 领 
域 的 大 师 ， 但 他 讲授 了 很 多 领域 的 知识 ， 的 确 帮 助 了 很 多 人 。 过 去 十 几 
年 我 一 直 从 事 编程 方面 的 工作 ， 也 在 不 断 学 习 和 思考 ， 我 想 ， 只 要 用 心 
写 ， 人 至 少 会 给 一 些 人 带 来 一 点 帮助 吧 。 


于 是 ， 我 在 2016 年 3 月 创建 了 微 信 公 众 号 “ 老 马 说 编程 >， 开始 发 布 
系列 文章 * 计 算 机 程序 的 思维 逻辑 ”。 每 一 篇 文章 对 我 都 是 一 个 挑战 ， 每 
一 个 知识 点 我 都 花 大 量 时 间 用 心思 考 ， 反 复 琢 麻 ， 力 求 表 达 清 晰 透彻 ， 
做 到 最 好 。 写 作 是 一 个 犹 兰 和 快乐 交织 的 过 程 ， 最 痛 舌 的 就 是 满 脑子 都 
征 相 关 的 内 容 ， 但 就 是 不 知道 该 怎么 表达 的 时 候 ， 而 最 快乐 的 就 是 写 完 
一 篇 文章 的 时 候 。 令 人 欣 感 的 是 ， 这 些 文章 受到 了 大 量 读者 的 极 高 评 






































价 ， 他 们 的 溢 美 之 词 、 自 发 分 享 和 红包 赞赏 进一步 增强 了 我 写作 的 信心 
和 动力 。 到 2017 年 7 月 底 ， 共 写 了 95 篇 文章 ， 关 于 Java 编 程 的 基本 内 容 
也 就 写 完了 。 


在 写作 过 程 中 ， 很 多 读者 反馈 希望 文章 可 以 尽快 整理 成 书 ， 以 便 阅 
读 。2016 年 9 月 ， 机 械 工业 出 版 社 的 高 婧 雅 女士 联系 到 了 我 ， 商 讨 出 版 
ee 


本 书 特色 


本 书 致力 于 帮助 读者 真正 理解 Java 编 程 。 对 于 每 个 语言 特性 和 
API， 不 仅 介绍 其 概念 和 用 法 ， 还 分 析 了 为 什么 要 有 这 个 概念 ， 实 现 原 
理 是 什么 ， 背 后 的 思维 逻辑 是 什么 对 于 类 库 ， 分 析 了 大 量 源码 ， 使 读 
者 不 仅 知 其 然 ， 还 知 其 所 以 然 ， 以 透彻 理解 相关 知识 点 。 


本 书 虽 然 是 Java 语 言 描述 ， 但 以 更 为 通用 的 编程 逻辑 为 主 ， 融 入 了 
很 多 通用 的 编程 相关 知识 ， 如 二 进 制 、 编 码 、 数 据 结构 和 算法 、 设 计 模 
式 、 操 作 系 统 、 编 程 思维 等 ， 使 读者 不 仅 能 够 学 习 Java 语 言 ， 还 可 以 所 
升 整体 的 编程 和 计算 机 水 平 。 


本 书 不 仅 注 重 实现 原理 ， 而 且 重 视 实 用 性 。 本 书 介绍 了 很 多 实践 中 
常用 的 技术 ， 包 含 不 少 实际 开发 中 积累 的 经 验 和 教训 ， 使 读者 可 以 少 走 
一 些 弯 路 。 在 实际 开发 中 ， 我 们 经 常 使 用 一 些 高 层 的 系统 程序 、 框 染 和 
库 ， 以 提升 开发 效率 ， 本 书 也 介绍 了 如 何 利用 基本 API 开 发 一 些 系统 程 
序 和 框 名 ， 比 如 键 值 数 据 库 、 消 轧 队 列 、 序 列 化 框 名 、DI 《依赖 注入 ) 
容器 、AOP《〈 面 向 切面 编程 ) 框架 、 热 部 署 、 模 板 引 擎 等 ， 讲 解 这 些 内 
容 的 目的 不 是 为 了 “重新 发 明 轮 子 ”， 而 是 为 了 帮助 读者 更 好 地 理解 和 应 
用 高 层 的 系统 程序 与 框 染 。 


本 书 高 度 注重 表述 ， 尽 力 站 在 读者 的 角度 ， 循 序 渐 进 、 简 洁 透 彻 ， 
从 最 基本 的 概念 开始 ， 一 步 步 推导 出 更 为 高 级 的 概念 ， 在 介绍 每 个 知识 
点 时 ， 都 会 尽力 先 介绍 用 法 、 示 例 和 应 用 ， 再 分 析 实 现 原理 和 思维 逻 
ee 
目 关 知识 。 


本 书 侧重 于 Java 编 程 的 主要 概念 ， 绝 大 部 分 内 容 适 用 于 Java 5 以 上 




















的 版 本 ， 但 也 包含 了 最 近 几 年 Java 的 主要 更 新 ， 包 括 Java 8 引入 的 重要 
更 新 Lambda 表 达 式 和 水 数 化 编程 。 


读者 对 象 





本 书面 癌 所 有 而 望 进 一 步 理 解 编程 的 主要 概念 、 实 现 原理 和 思维 逻 
辑 的 读者 ， 有 具体 来 说 有 以 下 几 种 。 


初中 级 Java 开 发 者 : 本 书 采 用 Java 语 言 ， 侧 重 于 前 析 编 程 概念 背后 
的 实现 原理 和 内 在 逻辑 ， 同 时 包含 很 多 实际 编程 中 的 经 验 教 训 ， 上 所 以 ， 
对 于 Java 编 程 经 历 不 多 ， 对 计算 机 原理 不 太 了 解 、 对 Java 的 很 多 概念 一 
知 半 解 的 开发 人 员 ， 阅 读本 书 的 收获 可 能 最 大 ， 通 过 本 书 可 以 快速 提升 
Java 编 程 水 平 。 而 零 基 础 Java 开 发 者 ， 可 跳 过 原理 性 内 容 阅 读 。 


非 Java 语 言 的 开发 者 : 本 书 不 假设 读者 有 任何 Java 编 程 基础 ， 系 
统 、 全 面 、 细 致 地 讲述 了 Java 的 语法 和 类 库 ， 给 出 了 很 多 示例 。 另 外 ， 
本 书 介 绍 了 很 多 编程 的 通用 概念 、 知 识 、 数 据 结 构 、 设 计 模 式 、 算 法 、 
实现 原理 和 思维 逻辑。 同时 ， 全 书 的 讨论 都 尽量 站 在 一 个 通用 的 编程 语 
言 角 度 ， 而 非 Java 语 言 特定 的 角度 。 通 过 阅读 本 书 ， 读 者 可 以 快速 学 习 
和 和 掌握 Java， 建 立 与 其 他 语言 之 间 的 联系 ， 提 升 整体 编程 思维 和 水 平 。 


中 高 级 Java 开 发 者 : 经 验 丰 富 的 Java 开 发 者 阅读 本 书 的 收获 也 会 很 
大 ， 可 以 通过 本 书 对 编程 有 更 为 系统 、 更 为 深刻 的 认识 。 


如 何 阅 读本 书 


本 书 分 为 六 大 部 分 ， 共 26 章 内 容 。 


第 一 部 分 (第 1~~2 半 ) 介绍 编程 基础 与 二 进 制 。 第 1 章 介 绍 编程 的 
基础 知识 ， 包 括 数 据 类 型 、 变 量 、 赋 值 、 基 本 运算 、 条 件 执行 、 循 环 和 
函数 。 第 2 半 帮 助 读者 理解 数据 背后 的 二 进 制 ， 包 括 整数 的 二 进 制 表示 
与 位 运算 、 小 数 计 算 为 什么 会 出 错 、 字 符 的 编码 与 乱码 。 


第 二 部 分 〈 第 3 一 7 草 ) 介绍 面 问 对 象 。 第 3 章 介 绍 类 的 基础 知识 ， 
包括 类 的 基本 概念 、 类 的 组 合 以 及 代码 的 基本 组 织 机 制 。 第 4 章 介 绍 类 
的 继承 ， 包 括 继 承 的 基本 概念 、 细 市 、 实 现 原理 ， 分 析 为 什么 说 继承 是 























把 双 为 全 。 第 5 革 介 绍 类 的 一 些 扩展 概念 ， 包 括 接 口 、 抽 象 类 、 内 部 类 
和 枚 举 。 第 6 章 介 绍 异常 。 第 7 章 训 析 一 些 和 常用 基础 类 ， 包 括 包 装 类 、 
String、StringBuilder、Arrays、 日 期 和 时 间 、 随 机 。 


第 三 部 分 〈 第 8 一 12 章 ) 介绍 泛 型 与 容器 及 其 背后 的 数据 结构 和 算 
法 。 第 8 章 介 绍 泛 型 ， 包 括 其 基本 概念 和 原理 、 通 配 符 ， 以 及 一 些 细节 
和 局 限 性 。 第 9 章 介 绍 列 表 和 和 队列， 剖析 ArrayList、LinkedList 以 及 
ArrayDeque。 第 10 章 介绍 各 种 Map 和 Set， 剖 析 HashMap、HashSet、 排 
序 二 叉 树 、TreeMap、TreeSet、LinkedHashMap、LinkedHashSet、 
EnumMap 和 EnumSet。 第 11 章 介绍 堆 与 优先 级 队列 ， 包 括 堆 的 概念 和 算 
法 及 其 应 用 。 第 12 间 介绍 一 些 抽 象 容器 类 ， 分析 通用 工具 类 
Collections， 最 后 对 整个 容器 类 体系 从 多 个 角度 进行 系统 总 结 。 


第 四 部 分 〈 第 13 一 14 章 ) 介绍 文件 。 第 13 章 主要 介绍 文件 的 基本 
技术 ， 包 括 文 件 的 一 些 基 本 概念 和 常识 、Java 中 处 理 文件 的 基本 结构 、 
二 进 制 文件 和 字 市 流 、 文 本 文件 和 字符 流 ， 以 及 文件 和 目录 操作 。 第 14 
半 介 绍 文件 处 理 的 一 些 局 级 技术 ， 包 括 一 些 常 见 文件 类 型 的 处 理 、 随 机 
读 写 文件 、 内 存 映射 文件 、 标 准 序列 化 机 制 ， 以 及 Jackson 序 列 化 。 


第 五 部 分 〈 第 15 一 20 音 ) 介绍 并 发 。 第 15 章 介绍 并 发 的 传统 基础 
知识 ， 包 括 线程 的 基本 概念 、 线 程 同 步 的 基本 机 制 synchronized、 线 程 
协作 的 基本 机 制 waitnotify， 以 及 线程 的 中 断 。 第 16 章 介绍 并 发 包 的 基 
石 ， 包 括 原 子 变量 和 CAS、 显 式 锁 与 显 式 条 件 。 第 17 章 介绍 并 发 容器 ， 
包括 写 时 复制 的 List 和 Set、ConcurrentHashMap、 基 于 跳 表 的 Map 和 
Set， 以 及 各 种 并 发 队列 。 第 18 章 介绍 异步 任务 执行 服务 ， 包 括 基 本 概 
念 和 实现 原理 、 主 要 的 实现 机 制 线程 池 ， 以 及 定时 任务 。 第 19 章 介绍 一 
些 专门 的 同步 和 协作 工具 类 ， 包 括 读 写 锁 、 信 号 量 、 倒 计时 门 栓 、 循 环 
栅栏 ， 以 及 ThreadLocal。 第 20 章 对 整个 并 发 部 分 从 多 个 角度 进行 系统 总 
和 











第 六 部 分 〈 第 21 一 26 章 ) 介绍 动态 与 函数 式 编程 。 第 21 章 介绍 反 
射 ， 包 括 反 射 的 用 法 和 应 用 。 第 22 章 介绍 注解 ， 包 括 注 解 的 使 用 、 创 
建 ， 以 及 两 个 应 用 : 定制 序列 化 和 DI 容器 。 第 23 章 介绍 动态 代理 的 用 法 
和 原理 ， 包 括 Java SDK 动 态 代理 和 cglib 动 态 代 理 以 及 一 个 应 用 : AOP。 
第 24 章 介绍 类 加 载 机 制 ， 包 括 类 加 载 的 基本 机 制 和 过 程 ，ClassLoader 的 
用 法 和 目 定 义 ， 以 及 它们 的 应 用 : 可 配置 的 策略 与 热 部 署 。 第 25 章 介绍 
正则 表达 式 ， 包 括 语法 、Java API、 一 个 简单 的 应 用 (模板 引擎) ， 最 
后 剖析 一 些 和 常见 表达 式 。 第 26 章 介绍 Java 8 引入 的 函数 式 编程 ， 包 括 


Lambda 表 达 式 、 函 数 式 数 据 处 理 、 组 合式 异步 编程 ， 以 及 Java 8 的 日 期 
和 时 间 API。 


对 于 有 一 定 经 验 的 读者 ， 可 以 挑选 感 兴趣 的 章节 直接 阅读 。 而 对 于 
初学 者 ， 建 议 从 头 阅读 ， 但 对 于 一 些 比较 深入 的 原理 性 内 容 ， 以 及 一 些 
比较 高 级 的 内 容 ， 如 果 理 解 比较 困难 可 以 跳 过 ， 有 一 定 实践 经 验 后 再 回 
头 阅读 。 任 何 读者 都 可 以 将 本 书 作为 一 本 案头 参考 书 ， 以 备 随时 查阅 不 
确定 的 概念 、 用 法 和 原理 。 








勘误 和 支持 


由 于 笔者 的 水 平 有 限 ， 编 写 时 间 仓 促 ， 书 中 难免 会 出 现 一 些 错误 或 
者 不 准确 的 地 方 ， 恳 请 读者 批评 指正 。 如 有 果 读 者 有 更 多 的 宝贵 意见 ， 欢 
迎 关 注 我 的 微 信 公众 号 “ 老 马 说 编程 ”， 可 在 后 人 台 留 言 ， 在 “关于 ?部 分 也 
有 最 新 的 微 信 和 QQ 群 信息 ， 欢 迎 加 入 讨论 ， 我 会 尽量 提供 满意 的 解 
答 。 同 时 ， 读 者 也 可 以 通过 邮箱 swiftma@sina.com 联 系 到 我 。 期 待 得 到 
你 们 的 真挚 反馈 ， 在 技术 之 路 上 互 勉 共 进 。 





致谢 


感谢 我 的 微 信 公众 号 “ 老 马 说 编程 ”、 掘 金 、 开 发 者 头条 和 博客 园 技 
术 社 区 的 广大 读者 ， 他 们 的 极 高 评价 、 目 发 分 齐 和 红包 赞 贯 让 我 备 受 喜 
舞 ， 更 重要 的 是 ， 他 们 指出 了 很 多 文章 中 的 错误 ， 使 我 可 以 及 时 修正 。 


感谢 掘 金 和 开发 者 头条 技术 社区 ， 他 们 经 常 推荐 我 的 文章 ， 使 更 多 
人 可 以 看 到 。 


感谢 我 在 北京 理工 大 学 学 习 时 的 老师 和 同学 们 ， 在 老师 的 教导 和 同 
学 们 的 探讨 中 ， 我 掌握 了 比较 扎实 的 计算 机 基础 ， 特 别 是 我 的 已 故 恩师 
古 志 民 教 授 ， 上 古 教 授 指 导 我 完成 了 本 科 到 博士 的 学 业 ， 他 严谨 认真 的 学 
术 态 度 深 深 地 影响 了 我 。 


感谢 我 工作 以 来 的 领导 和 同事 们 ， 由 于 他 们 的 言传 号 教 ， 我 得 以 不 
上 条 提 高 自己 的 技术 水 平 。 


感谢 机 械 工 业 出 版 社 的 编辑 高 婧 雅 ， 在 一 年 多 的 时 间 中 始终 文 持 我 








的 写作 ， 她 的 帮助 和 建议 引导 我 顺利 完成 全 部 书稿 。 
特别 致谢 


特别 感谢 我 的 爱人 吴 特 和 儿子 久久 ， 我 为 写作 这 本 书 ， 牺 牲 了 很 多 
I 





特别 感谢 我 天 父母 ， 特 别 是 我 的 岳母 ， 不 踪 余 力 地 帮助 我 们 照顾 儿 
子 ， 有 了 他 们 的 帮助 和 支持 ， 我 才 有 时 间 和 精力 去 完成 写作 工作 。 


特别 感谢 我 的 父母 ， 他 们 在 困难 的 生活 条 件 下 ， 付 出 了 巨大 的 汗水 
与 心血 ， 将 我 养育 成 人 ， 使 我 能 够 完成 博士 学 业 ， 他 们 一 生 勤 孝 朴素 的 
品质 深 深 地 影响 了 我 。 





特别 感谢 我 的 兄长 马 俊杰 ， 他 一 直 是 我 成 长 路 上 的 指明 灯 ， 也 是 从 
他 的 耐心 讲解 中 我 第 一 次 了 解 到 了 计算 机 的 基本 工作 机 制 。 


谨 以 此 书 献 给 我 最 亲爱 的 家 人 ， 以 及 众多 热爱 编程 技术 的 朋友 们 ! 





理解 数据 背后 的 二 进 制 


第 1 章 ”编程 基础 
我 们 先 来 简单 介绍 何谓 编程 ， 以 及 编 出 来 的 程序 大 概 是 什么 样子 。 


计算 机 是 个 机 右 ， 这 个 机 器 主要 由 CPU、 内 存 、 便 盘 和 输入 /输出 
设备 组 成 。 计 算 机 上 跑 着 操作 系统 ， 如 Windows 或 Linux， 操 作 系 统 上 
运行 着 各 种 应 用 程序 ， 如 Word、QQ 等 。 


操作 系统 将 时 间 分 成 很 多 细小 的 时 间 片 ， 一 个 时 间 片 给 一 个 程序 
用 ， 力 一 个 时 间 片 给 男 一 个 程序 用 ， 并 频繁 地 在 程序 间 切 换 。 不 过 ， 在 
应 用 程序 看 来 ， 整 个 机 融资 源 好 像 都 归 它 使 用 ， 操 作 系 统 给 它 制造 了 这 
种 假象 。 对 程序 员 而 言 ， 编 写 程序 时 基本 不 用 考虑 其 他 应 用 程序 ， 做 好 
目 己 的 事 就 可 以 了 。 


应 用 程序 看 上 去 能 做 很 多 事情 ， 能 读 写 文档 、 能 播放 音乐 、 能 聊 
天 、 能 玩 游戏 、 能 下 围棋 等 ， 但 本 质 上 ， 计 算 机 只 会 执行 预先 写 好 的 指 
令 而 已 ， 这 些 指令 也 只 是 操作 数据 或 者 设备 。 所 谓 程序 ， 基 本 上 惑 是 后 
on 

0D: 








1) 该 文档 ， 束 是 将 数据 从 磁盘 加 载 到 和 内存， 然后 输出 到 显示 顺 


2) 写 文 要 ， 就 是 将 数据 从 内 存 写 回 磁盘 ; 
3) 播放 音乐 ， 就 是 将 音乐 的 数据 加 载 到 内 存 ， 然 后 写 到 声卡 上 ; 


4) 聊天 ， 束 是 从 键盘 接收 聊天 数据 ， 放 到 内 存 ， 然 后 传 给 网 卡 ， 
通过 网 络 传 给 另 一 个 人 的 网 卡 ， 再 从 网 卡 传 到 内 存 ， 显 示 在 显示 器 上 。 


基本 上 ， 所 有 数据 都 需要 放 到 内 存 进 行 处 理 ， 程 序 的 很 大 一 部 分 工 
作 就 是 操作 在 内 存 中 的 数据 。 那 具体 如 何 表示 和 操作 数据 呢 ? 本 章 介绍 
一 些 基 础 知识 ， 具 体 分 为 7 个 小 市 。 


数据 在 计算 机 内 部 都 是 二 进 制 表示 的 ， 不 方便 操作 ， 为 了 方便 操作 
数据 ， 高 级 语言 引入 了 数据 类 型 和 变量 的 概念 ， 这 两 个 概念 我 们 在 1.1 


5 





表示 了 数据 后 ，1.2 市 介绍 能 对 数据 进行 的 第 一 个 操作 赋值 。 


数据 有 了 和 初始 值 之 后 ，1.3 节 介绍 可 以 对 数据 进行 的 一 些 基本 运 
Es 





为 了 编写 有 实用 功能 的 程序 ， 只 进行 基本 运算 是 远 远 不 够 的 ， 至 少 
需要 对 操作 的 过 程 进行 流程 控制 。 流 程控 制 有 两 种 : 一 种 是 条 件 执行 ; 
另外 一 种 是 循环 。 我 们 分 别 在 1.4 节 和 1.5 节 介绍 。 





为 了 减少 重复 代码 和 分 解 复杂 操作 ， 计 算 机 程序 引入 了 函数 和 子 程 
人 
原理 。 


1.1 数据 类 型 和 变量 
数据 类 型 用 于 对 数据 归 类 ， 以 便于 理解 和 操作 。 对 Java 语 言 而 言 ， 
有 如 下 基本 数据 类 型 。 


.整数 类 型 : 有 4 种 整 型 byte/shorUinVlong， 分 别 有 不 同 的 取 值 范 
围 ; 


:小 数 类 型 ， 有 两 种 类 型 float/double， 有 不 同 的 取 值 范围 和 精度 ; 

.字符 类 型 : char， 表 示 单 个 字符 ; 

: 真 假 类 型 : boolean， 表 示 真 假 。 

基本 数据 类 型 都 有 对 应 的 数组 类 型 ， 数 组 表示 固定 长 度 的 同 种 数据 
类 型 的 多 条 记录 ， 这 些 数据 在 内 存 中 连续 存放 。 比 如 ， 一 个 上 自然数 可 以 
用 一 个 整数 类 型 数据 表示 ，100 个 连续 的 自然 数 可 以 用 一 个 长 度 为 100 的 
整数 数组 表示 。 一 个 字符 可 以 用 一 个 char 类 型 数据 表示 ， 一 段 文字 可 以 
用 一 个 char 数 组 表示 。 

Java 是 面 问 对 象 的 语言 ， 除 了 基本 数据 类 型 ， 其 他 都 是 对 象 类 型 。 
对 象 到 底 是 什么 呢 ? 简单 地 说 ， 对 象 是 由 基本 数据 类 型 、 数 组 和 其 他 对 
象 组 合 而 成 的 一 个 东西 ， 以 方便 对 其 整体 进行 操作 。 比 如 ， 一 个 学 生 对 
象 ， 可 以 由 如 下 信息 组 成 。 

姓名: 一 个 字符 数组 ; 

:年龄 : 一 个 整数 ; 

性别: 一 个 字符 ; 

:入 学 分 数 : 一 个 小 数 。 

日 期 在 Java 中 也 是 一 个 对 象 ， 内 部 表示 为 整 型 long。 


世界 万 物 都 是 由 元 系 周 期 表 中 的 基本 元 素 组 成 的 ， 基 本 数据 类 型 就 
相当 于 化 学 中 的 基本 元 系 ， 而 对 象 就 相当 于 世界 万 物 。 








为 了 操作 数据 ， 需 要 把 数据 存放 到 内 存 中 。 所 谓 内 存在 程序 看 来 就 
古 一 块 有 地 址 编写 的 连续 的 空间 ， 数 据 放 到 内 存 中 的 某 个 位 置 后 ， 2 
方便 地 找到 和 操作 这 个 数据 ， 需 要 给 这 个 位 置 起 一 个 名 字 。 编 程 语言 通 
过 变量 这 个 概念 来 表示 这 个 过 程 。 


声明 一 个 变量 ， 比 如 int a， 其 实 就 是 在 内 存 中 分 配 了 一 块 空间 ， 这 
块 空 = 间 存 放 in 数据 类 型 a 指 向 这 块 内 存 空 间 所 在 的 位 置 ， 通 过 对 a 操 作 
ee 比如 a=5 这 个 操作 即 可 将 a 指向 的 内 存 空间 
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之 所 以 叫 " 变 ” 量 ， 是 因为 它 表示 的 是 内 存 中 的 位 置 ， 这 个 位 置 存 放 
的 值 是 可 以 变化 的 。 


虽然 变量 的 值 是 可 以 变化 的 ， 但 变量 的 名 字 是 不 变 的 ， 这 个 名 字 应 
该 代表 程序 员 心 目 中 这 块 内 存 空间 的 意义 ， 这 个 意义 应 该 是 不 变 的 。 比 
如 ， 变 量 int second 表 示 时 钟 秒 数 ， 在 不 同时 间 可 以 被 赋予 不 同 的 值 ， 但 
7 时 钟 秒 数 。 之 所 以 说 应 该 ， 是 因为 这 不 是 必需 的 ， 如 
果 一 定 要 为 一 个 名 为 age 的 变量 赋予 身高 的 值 ， 计 算 机 也 拿 你 没 办 法 。 


重要 的 话 再 说 一 所 ! 方便 找 不 同 的 数据 ， 
它 的 值 可 以 变 ， 但 言 义 不 应 变 。 再 比如 说 一 个 合同 ， 可 以 有 4 个 变量 : 


first_party: 含义 是 甲 方 ; 























.Second_party: 含义 是 乙方 ; 
:contract body: 含义 是 合同 内 容 
contract_sign_date: 含义 是 合同 签署 日 期 。 


这 些 变 量 表示 的 含义 是 确定 的 ， 但 对 不 同 的 合同 ， 它 们 的 值 是 不 同 
的 。 初 学 编程 的 人 经 常 使 用 像 4、b、c、hehe、haha 这 种 无 意义 的 名 字 。 
在 此 建议 为 变量 起 一 个 有 意义 的 名 字 吧 ! 通过 声明 变量 ， 每 个 变量 赋予 
Pe 我 们 就 告诉 了 计算 机 要 操作 的 数 
虎 。 


有 了 数据 ， 如 何 对 数据 进行 操作 呢 ? 我 们 先 来 看 对 数据 能 做 的 第 一 
个 操作 : 赋值 。 





1.2 ”赋值 


声明 变量 之 后 ， 就 在 内 存 分 配 了 一 块 位 置 ， 但 这 个 位 置 的 内 容 是 未 
知 的 ， 赋 值 就 是 把 这 块 位 置 的 内 容 设 为 一 个 确定 的 值 。Java 中 基本 类 
型 、 数 组 、 对 象 的 赋值 有 明显 不 同 ， 本 节 介绍 基本 类 型 和 数组 的 赋值 ， 
对 象 的 赋值 第 3 章 再 介绍 。 








1.2.1 基本 类 型 


(1) 整数 类 型 


整数 类 型 有 byte、short、int 和 long， 分 别 占 1、2、4、8 个 字 节 ， 取 
值 范围 如 表 1-1 所 示 。 


表 1-1 整数 类 型 和 取 值 范围 


类 型 名 取 值 范围 类 型 取 值 范围 





我 们 用 ^ 表 示 指 数 ，2^7 即 2 的 7 次 方 。 这 个 范围 我 们 不 需要 记得 那么 
清楚 ， 有 个 大 概 范围 认识 就 可 以 了 。 第 2 章 会 从 二 进 制 的 角度 进一步 分 
析 表 示范 围 为 什么 会 是 这 样 的 。 

赋值 形式 很 简单 ， 直 接 把 熟悉 的 数字 币 量 形式 赋值 给 变量 即 可 ， 对 


应 的 内 存 空间 的 值 就 从 未 知 变 成 了 确定 的 常量 。 但 常量 不 能 超过 对 应 类 
型 的 表示 范围 。 例 如 : 











byte b = 23; 
Short s = 3333 
int i = 9999 
long 1 = 32323; 








但 是 ， 在 给 long 类 型 赋值 时 ， 如 果 常 量 超过 了 int 的 表示 范围 ， 需 要 
在 常量 后 面 加 大 写 或 小 写字 母 L， 即 [或 1， 例 如 ， 





long a = 3232343433L 








之 所 以 需要 加 工 或 1]， 是 因为 数字 各 量 默认 为 是 int 类 型 。 
(2) 小 数 类 型 
小 数 类 型 有 float 和 double， 占 用 的 内 存 空 间 分 别 是 4 和 8 字 节 ， 有 不 


Bb double 表 示 的 范围 更 大 ， 精 度 更 高 ， 有 共 体 如 表 1-2 
外。 


表 1-2 小数 类 型 和 取 值 范围 


1.4E_45~3.4E+38 Pe 4.9E_324~1.7E+308 
i -3.4Bt38-=_1.4B-45 ee -1.7E+308 一 -4.9E-324 


取 值 范围 看 上 去 很 奇怪 ， 一 般 也 不 需要 记 住 ， 有 个 大 概 印 象 就 可 以 
了 。E 表 示 以 10 为 底 的 指数 ，E 后 面 的 + 号 和 -号 代表 正 指数 和 负 指 数 ， 例 
ee 第 2 章 会 进一步 分 析 小 数 的 二 进 
制 表示 。 


对 于 double， 直 接 把 熟悉 的 小 数 表 示 赋 值 给 变量 即 可 ， 例 如 : 














double d = 333.33,; 








但 对 于 float， 需 要 在 数字 后 面 加 大 写字 母 F 或 小 写字 母 f， 例 如 : 





float f = 333.33f; 





这 是 由 于 小 数 第 量 默 认 是 double 类 型 。 
除了 小 数 ， 也 可 以 把 整数 直接 赋值 给 float 或 double， 例 如 : 





float f = 33; 
double d = 3333333333333L; 





(3) 真 假 类 型 


真 假 〈boolean) 类 型 很 简单 ， 直 接 使 用 true 或 false 赋 值 ， 分 别 表示 
真 和 假 ， 例 如 : 





boolean b = true; 
b = false; 





(4) 字符 类 型 

字符 类 型 char 用 于 表示 一 个 字符 ， 这 个 字符 可 以 是 中 文字 符 ， 也 可 
以 是 身 文 字符 ，char 占 用 的 内 存 空间 十 两 个 字 节 。 冉 值 时 把 常量 字符 用 
单 引 号 括 起 来 ， 不 要 使 用 双 引 号 ， 例 如 : 














大 部 分 的 第 用 字符 用 一 个 char 就 可 以 表示 ， 但 有 的 特殊 字符 用 一 个 
char 表 示人 不 了 。 此 外 ， 关 于 char 还 有 一 些 其 他 细 市 ， 我 们 在 2.4 节 再 进 一 
步 解 释 。 


前 面 介绍 的 赋值 都 是 直接 给 变量 设置 一 个 常量 值 ， 但 也 可 以 把 变量 
赋 给 变量 ， 例 如 : 











int a = 100; 
int b = a; 





SR 《1.3 节 介绍 ) ， 也 可 以 将 变量 的 运算 结 
赋 给 变量 ， 儿 : 











*a+b; //2 乘 以 a 的 值 再 加 上 b 的 信 赋 给 c 




















前 面 介绍 的 赋值 都 是 在 声明 变量 的 时 候 就 进行 了 赋值 ， 但 这 不 是 必 
需 的 ， 可 以 先 声 明 变 量 ， 随 后 再 进行 赋值 。 


1.2.2 数组 类 型 


基本 类 型 的 数组 有 3 种 赋值 形式 ， 如 下 所 示 : 





1. int[] arr = {1,2,3}; 

2. int[] arr = new int[]{1,2,3}; 

3. int[] arr = new int[3]; 
arr[0]=1; arr[1]=2; arr[2]=3; 





第 1 种 和 第 2 种 都 是 预先 知道 数组 的 内 容 ， 而 第 3 种 是 先 分 配 长 度 ， 
然后 再 给 每 个 元 素 赋 值 。 第 3 种 形式 中 ， 即 使 没有 给 每 个 元 素 赋 值 ， 每 
个 元 素 也 都 有 一 个 默认 值 ， 这 个 默认 值 跟 数组 类 型 有 关 ， 数 值 类 型 的 值 
为 0，boolean 为 false，char 为 空 字 符 。 


数组 长 度 可 以 动态 确定 ， 如 下 所 示 : 














int length = ... ;// 根 据 一 些 条 件 动 态 计 算 
int arr = new int[length]; 











数组 长 度 虽 然 可 以 动态 确定 ， 但 定 了 之 后 就 不 可 以 变 。 数 组 有 一 个 
length 属 性 ， 但 只 能 读 ， 不 能 改 。 还 有 一 个 小 细节 ， 不 能 在 给 定 初 始 值 
的 同时 给 定 长 度 ， 即 如 下 格式 是 不 允许 的 : 





int[] arr = new int[3]{1,2,3} 





可 以 这 么 理解 ， 因 为 初始 值 已 经 决定 了 长 度 ， 再 给 个 长 度 ， 如 果 还 
不 一 致 ， 计 算 机 将 无 所 适 从 。 


数组 类 型 和 基本 类 型 是 有 明显 不 同 的， 一 个 基本 类 型 变量 ， 内 存 中 
只 会 有 一 块 对 应 的 内 存 空 间 。 但 数组 有 两 块 : 一 块 用 于 存储 数组 内 容 本 
身 ， 另 一 块 用 于 存储 内 容 的 位 置 。 用 一 个 例子 来 说 明 ， 有 一 个 int 变 量 
I 
0 表 1-3 所 示 。 








表 1-3 ”变量 对 应 的 内 存 地 址 和 内 容 


代 码 内 存 地 址 内 存 数 据 
int a = 100; 1000 100 
int[] aif = {1,2,3}; 


基本 类 型 的 内 存 地 址 是 1000， 这 个 位 置 存储 的 就 是 它 的 值 100。 数 
组 类 型 arr 的 内 存 地 址 是 2000， 这 个 位 置 存储 的 值 是 一 个 位 置 3000，3000 
开始 的 位 置 存 储 的 才 是 实际 的 数据 “1，2，3”。 


为 什么 数组 要 用 两 块 空间 ? 不 能 只 用 一 块 空间 吗 ? 我 们 来 看 下 面 
这 段 代码 : 


int[] arrA = {1,2,3}; 
int[] arrB = {4,5,6,7}; 
arrA = arrB， 





这 段 代 码 中 ，arrA 初 始 的 长 度 是 3，arrB 的 长 度 是 4， 后 来 将 arrB 的 
值 赋 给 了 arrA。 如 果 arrA 对 应 的 内 存 空 间 是 直接 存储 的 数组 内 容 ， 那 么 
它 将 没有 足够 的 空间 去 容纳 arrB 的 所 有 元 素 。 


用 两 块 空间 存储 就 简单 得 多 ，arrA 存 储 的 值 就 变 成 了 和 arB 的 一 
样 ， 存储 的 都 是 数组 内 容 {4，5，6，7} 的 地 址 ， 此 后 访问 arrA 就 和 arrB 
是 一 样 的 了 ， 而 arrA{1，2，3} 的 内 存 空间 由 于 不 再 被 引用 会 进行 垃圾 
回收 ， 如 下 所 示 : 











arrA {1,2,3} 
\ 


\ 
arrB -> {4,5,6,7} 


由 上 也 可 以 看 出 ， 给 数组 变量 赋值 和 给 数组 中 元 素 赋 值 是 两 回 事 ， 
给 数组 中 元 系 赋 值 是 改变 数组 内 容 ， 而 给 数组 变量 赋值 则 会 让 变量 指 问 
一 个 不 同 的 位 置 。 


上 面 我 们 说 数组 的 长 度 是 不 可 以 变 的 ， 不 可 变 指 的 是 数组 的 内 容 空 
间 ， 一 经 分 配 ， 长 度 束 不 能 再 变 了 ， 但 可 以 改变 数组 变量 的 值 ， 让 它 指 


向 一 个 长 度 不 同 的 空间 ， 就 像 上 例 中 arrA 后 来 指向 了 arrB 一 样 。 


给 变量 赋值 就 是 将 变量 对 应 的 内 存 空 间 设置 为 一 个 明确 的 值 ， 有 了 
值 之 后 ， 变 量 可 以 被 加 载 到 CPU，CPU 可 以 对 这 些 值 进行 各 种 运算 ， 运 
算 后 的 结果 又 可 以 被 赋值 给 变量 ， poe 数据 可 以 进行 哪些 运 
算 ? 如 何 进 行 运算 呢 ? 我 们 下 市 介绍 








1 二 本 运气 


有 了 初始 值 之 后 ， 可 以 对 数据 进行 运算 。 运 算 有 不 同 的 类 型 ， 不 同 
0 
运算 。 

.算术 运算 : 主要 是 日 间 的 加 减 乘 除 。 

:比较 运算 : 主要 是 日 常 的 大 小 比较 。 

.逻辑 运算 : 针对 布尔 值 进行 运算 。 


1.3.1 算术 运算 








算术 运算 符 有 加 、 减 、 乘 、 除 ， 符 号 分 别 是 +、-、*、/， 另 外 还 有 
取 模 运算 符 %， 以 及 自 增 (++) 和 上 自 减 〈--) 运算 符 。 取 模 运 算 适 用 于 
整数 和 字符 类 型 ， 其 他 算术 运算 适用 于 所 有 数值 类 型 和 字符 类 型 。 大 部 
分 运算 都 符合 我 们 的 数学 常识 ， 但 字符 怎么 也 可 以 进行 算术 运算 ? 我 们 
到 2.4 节 再 解释 。 

减 号 〈-) 通常 用 于 两 个 数 相 减 ， 但 也 可 以 放 在 一 个 数 前 面 ， 例 如 - 
a， 这 表示 改变 a 的 符号 ， 原 来 的 正 数 会 变 为 负数 ， 原 来 的 负数 会 变 为 正 
数 ， 这 也 是 符合 我 们 常识 的 。 

取 模 (%) 就是 数学 中 的 求 余 数 ， 例 如 ，5%3 是 2，10%5 是 0。 


自 增 (++) 和 自 减 〈--) ， 是 一 种 快捷 方式 ， 是 对 自己 进行 加 1 或 
减 1 操 作 。 

加 、 减 、 乘 、 除 大 部 分 情况 和 数学 运算 是 一 样 的 ， 都 很 容易 理解 ， 
但 有 一 些 需要 注意 的 地 方 ， 而 自 增 、 自 减 稍微 复杂 一 些 ， 下 面 我 们 解释 
Ts 

















1. 加 、 减 、 乘 、 除 注意 事项 


运算 时 要 注意 结果 的 范围 ， 使 用 恰当 的 数据 类 型 。 两 个 正 数 都 可 以 


用 int 表 示 ， 但 相 乘 的 结果 可 能 就 会 超出 ， 超 出 后 结果 会 令 人 困惑 ， 例 
如 : 





int a = 2147483647*2; //2147483647 是 int 能 表示 的 最 大 值 





a 的 结果 是 -2。 为 什么 是 -2 我 们 暂 不 解释 ， 要 避免 这 种 情况 ,我们 的 
结果 类 型 应 使 用 long， 但 只 改 为 long 也 是 不 够 的 ， 因 为 运算 还 是 默认 按 
照 int 类 型 进行 ， 需 要 将 至 少 一 个 数据 表示 为 long 形 式 ， 即 在 后 面 加 IL 或 
1]， 下 面 这 样 才 会 出 现 期望 的 结果 : 











long a = 2147483647*2L 





0 
立 ， 例如 : 





double d = 10/4; 





结果 是 2 而 不 是 2.5， 如 果 要 按 小 数 进行 运算 ， 需 要 将 至 少 一 个 数 表 
示 为 小 数 形 式 ， 或 者 使 用 强制 类 型 转化 ， 即 在 数字 前 面 加 〈double) ， 
表示 将 数字 看 作 double 类 型 ， 如 下 所 示 任 意 一 种 形式 都 可 以 : 





a) double d = 10/4.0; 
b) double d = 10/(double)4; 





2. 小 数 计算 结果 不 精确 


无 论 是 使 用 float 还 是 double， 进 行 运算 时 都 会 出 现 一 些 非常 令 人 困 





float f = 0.1f*0.1f; 
System.out.println(f); 





这 个 结果 看 上 去 应 该 是 0.01， 但 实际 上 ， 屏 幕 输 出 却 是 
0.010000001， 后 面 多 了 个 1。 换 用 double 看 看 : 








double d = 0.1*0.1; 
System.out.println(d); 


屏幕 输出 0.010000000000000002， 一 连 串 的 0 之 后 多 了 个 2， 结 果 也 


不 精确 。 


这 是 怎么 回 事 ? 看 上 去 这 么 简单 的 运算 ， 计 算 机 计算 的 结果 怎么 不 
精确 呢 ? 但 事实 就 是 这 样 ， 究 其 原因 ， 我 们 需要 理解 float 和 double 的 二 





进 制 表示 ， 我 们 到 2.2 节 再 进行 分 析 。 
3. 自 增 (++) / 自 减 〈--) 


目 增 / 目 减 是 对 目 己 做 加 1 或 减 1 操作 ， 但 每 个 都 有 两 种 形式 ， 一 种 
是 放 在 变量 后 ， 例 如 at++、a--， 男 一 种 是 放 在 变量 前 ， 例 如 ++a、--a。 














如 果 只 是 对 自己 操作 ， 这 两 种 形式 也 没什么 差别 ， 区 别 在 于 还 有 其 
他 操作 的 时 候 。 放 在 变量 后 (at++) 是 先 用 原来 的 值 进行 其 他 操作 ， 然 
后 再 对 目 己 做 修改 ， 而 放 在 变量 前 〈++a) 是 先 对 自己 做 修改 ， 再 用 修 





改 后 的 值 进 行 其 他 操作 。 例 如 ， 快 捷 运 算 和 其 等 同 的 运算 如 表 1-4 所 
示 。 
表 1-4 人 快捷 运算 和 其 等 同 的 运算 
快捷 运算 等 同 运算 


b=a—1 
a=8 十 1 


b=a++—1 


a=a+l] 


c=a—1 


c=++a—l 


j=j+1 
arrA[i++]=arrB[++]] arrA[i|]=arrB[] 
i=1+1 





目 增 / 自 减 是 “快捷 ”操作 ， 是 让 程序 员 少 写 代 码 的 ， 但 遗憾 的 是 ， 
于 比较 奇怪 的 语法 和 将 异 的 行为 ， 给 初学 者 市 来 了 一 些 困 惑 。 





1.3.2 ”比较 运算 


比较 运算 就 是 计算 两 个 值 之 间 的 关系 ， 结 果 是 一 个 布尔 类 型 


(boolean) 的 值 。 比 较 运 算 适 用 于 所 有 数值 类 型 和 字符 类 型 。 数 值 类 型 
容易 理解 ， 但 字符 怎么 比 呢 ? 我 们 到 2.4 节 再 解释 。 


比较 操作 待 有 大 于 《> ) 、 大 于 等 于 (>=) 、 小 于 《〈 冬 ) 、 小 于 等 
下 


大 部 分 也 都 是 比较 直观 的 ， 需 要 注意 的 是 等 于 。 首 先 ， 它 使 用 两 个 
等 号 ==， 而 不 是 一 个 等 号 =。 为 什么 不 用 一 个 等 号 呢 ? 因为 一 个 等 号 = 
已 经 被 占 了 ， 表 示 赋 值 操 作 。 另 外 ， 对 于 数组 ，== 判 断 的 是 两 个 变量 指 
回 的 是 不 是 同一 个 数组 ， 而 不 是 两 个 数组 的 元 素 内 容 是 否 一 样 ， 即 使 两 
人 但 如 果 是 两 个 不 同 的 数组 ，== 依 然 会 返回 
false, : 

















int[] a = new int[] {1,2,3}; 
int[] b = new int[] {1,2,3}; 
//a==b 的 结果 是 false 





i 比较 数组 的 内 容 是 人 否 一 样 ， 需 要 逐个 比较 里 面 存 储 的 每 个 
元 素 。 


1.3.3 ”逻辑 运算 





逻辑 运算 根据 数据 的 逻辑 关系 ， 生 成 一 个 布尔 值 true 或 者 false。 柳 
辑 运算 只 可 应 用 于 boolean 类 型 的 数据 ， 但 比较 运算 的 结果 是 布尔 值 ， 所 
以 其 他 类 型 数据 的 比较 结果 可 进行 逻辑 运算 。 

逻辑 运算 符 具体 有 以 下 这 些 。 

与 〈&) : 两 个 都 为 true 才 是 true， 只 要 有 一 个 是 false 就 是 false; 

:或 (|) : 只 要 有 一 个 为 true 就 是 true， 都 是 false 才 是 false; 

非 〈《! ) : 针对 一 个 变量 ，true 会 变 成 false，false 会 变 成 true; 

异 或 〈^) : 两 个 相同 为 false， 两 个 不 相同 为 true; 

-短路 与 〈&&) : 和 & 类 似 ， 不 同 之 处 稍 后 解释 ; 


:短路 或 (|) : 与 | 类 似 ， 不 同 之 处 稍 后 解释 。 


逻辑 运算 的 大 部 分 部 是 比较 直观 的 ， 需 要 注意 的 是 && 和 &&， 以 及 | 
和 || 的 区 别 。 如 果 只 是 进行 逻辑 运算 ， 它 们 也 都 是 相同 的 ， 区 别 在 于 同 
时 有 其 他 操作 的 情况 下 ， 例 如 : 





boolean a = true; 
int b = 0; 
boolean flag = a | b++>0; 





因为 a 为 tue， 所 以 flag 也 为 tue， 但 b 的 结果 为 1， 因 为 | 后 面 的 式 子 
也 会 进行 运算 ， 即 使 只 看 a 已经 知道 flag 的 结果 ， 还 是 会 进行 后 面 的 运 
算 。 而 | 则 不 同 ， 如 果 最 后 一 句 的 代码 是 : 





boolean flag = a || b++>0; 


则 b 的 值 还 是 0， 因 为 | 会 < 短路 "， 即 在 看 到 | 前 面部 分 就 可 以 判定 结 
果 的 情况 下 ， 忽 略 | 后 面 的 运算 。 


134 .外乡 

本 节 介 绍 了 Java 中 基本 类 型 数据 的 主要 和 运算， 包括 算术 和 运算、 比较 
运算 和 逻辑 运算 。 

-个 稍微 复杂 的 运算 可 能 会 涉及 多 个 变量 和 多 种 运算 ， 那 哪个 先 
算 ， 哪 个 后 算 呢 ? 程序 语言 规定 了 不 同和 运算 符 的 优先 级 ， 有 的 会 先 算 ， 
有 的 会 后 算 ， 大 部 分 情况 下 ， 这 个 优先 级 与 我 们 的 第 识 理解 是 相符 的 。 
但 在 一 些 复杂 情况 下 ， 我 们 可 能 会 搞 不 明白 其 运算 顺序 。 但 这 个 我 们 不 
用 太 操 心 ， 可 以 使 用 括号 〈) 来 表达 我 们 想 要 的 顺序 ， 括 号 里 的 会 先进 
行 运算 。 人 简单 来 说 ， 不 确定 顺序 的 时 候 ， 就 使 用 括号 。 

本 节 遗 留 了 一 些 问题 ， 比 如 : 


` 正 整数 相 乘 的 结果 居然 出 现 了 负数 ; 
非常 基本 的 小 数 运算 结果 居然 不 精确 ; 

















字符 类 型 也 可 以 进行 算术 运算 和 比较 。 


关于 这 些 问题 ， 我 们 到 第 2 章 再 进行 解释 。 为 了 编写 有 更 多 实用 功 
能 的 程序 ， 只 进行 基本 操作 是 远 远 不 够 的 ， 我 们 至 少 需要 对 操作 的 过 程 
进行 流程 控制 。 流 程控 制 主 要 有 两 种 : 一 种 是 条 件 执行 ， 另 外 一 种 是 循 
环 执行 ， 接 下 来 的 两 节 对 它们 进行 详细 介绍 。 











1.4 条 件 执行 


流程 控制 中 最 基本 的 就 是 条 件 执行 ， 也 就 是 说 ， 一 些 操作 只 能 在 茶 
些 条 件 满 足 的 情况 下 才 执行 ， 在 一 些 条 件 下 执行 茶 种 操作 ， 在 另外 一 些 
条 件 下 执行 另外 的 操作 。 这 与 交通 控制 中 的 红 灯 停 、 绿 灯 行 条 件 执行 是 
类 似 的 。 我 们 先 来 看 Java 中 表达 条 件 执行 的 语法 ， 然 后 介绍 其 实现 原 
Ts 

















1.4.1 语法 和 陷阱 


Java 中 表达 条 件 执 行 的 基本 语法 是 让 语句 ， 它 的 语法 是 : 





if( 条 件 语句 ){ 
代码 块 


起 


if( 条 件 语 句 ) 代码 ; 








表达 的 含义 也 非常 简单 ， 只 在 条 件 语句 为 真 的 情况 下 ， 才 执行 后 面 
的 代码 ， 为 假 束 不 执行 了 。 具 体 来 说 ， 条 件 语 句 必须 为 布尔 值 ， 可 以 是 
一 个 直接 的 布尔 变量 ， 也 可 以 是 变量 运算 后 的 结果 。 我 们 在 1.3 市 介绍 
过 ， 比 较 运算 和 风 辑 运算 的 结果 都 是 布尔 值 ， 所 以 可 作为 条 件 语句 。 条 
件 语 句 为 tue， 则 执行 括 写 们 中 的 代码 ， 如 果 后 面 没有 括号 ， 则 执行 后 
面 第 一 个 分 号 〈;， ) 前 的 代码 。 


比如 ， 只 在 变量 为 偶数 的 情况 下 输出 : 




















int a=10; 
if (a%2==0){ 
System.out.println(" 偶 数 "); 





} 


或 者 : 





int a=10; 
if(a%2==0) System.out.println(" 偶 数 "); 








证 的 陷阱 初学 者 有 时 会 忘记 在 站 后 面 的 代码 块 中 加 括号 ， 有 时 希 
望 执行 多 条 语句 而 没有 加 括号 ， 结 采 只 会 执行 第 一 条 语句 ， 建 议 押 有 让 
后 面 都 加 括号 。 


if 实 现 的 是 条 件 满足 的 时 候 做 什么 操作 ， 如 果 需 要 根据 条 件 做 分 
文 ， 即 满足 的 时 候 执行 某 种 逻辑 ， 而 不 满足 的 时 候 执行 另 一 种 逻辑 ， 则 
可 以 用 ifelse， 语 法 是 : 








if( 判 断 条 件 ){ 
代码 块 1 


}elset{ 
代码 块 2 


if/else 也 非常 简单 ， 判 断 条 件 是 一 个 布尔 值 ， 为 true 的 时 候 执 行 代码 
块 1， 为 假 的 时 候 执行 代码 块 2。 


1.3 节 介绍 了 各 种 基本 运算 ， 这 里 介绍 一 个 条 件 运 算 ， 和 ielse 很 








判断 条 件 ? 表达 式 1 : ”表达 式 2 








三 元 运算 符 会 得 到 一 个 结果 ， 判 断 条 件 为 真 的 时 候 就 返回 表达 式 1 
的 值 ， 否 则 就 返回 表达 式 2 的 值 。 三 元 运算 符 经 常用 于 对 某 个 变量 赋 
值 ， 例 如 求 两 个 数 的 最 大 值 : 





int max =x>y?x:y; 


三 元 运算 符 完全 可 以 用 if/else 代 蔡 ， 但 三 元 运算 符 的 书写 方式 更 简 
洁 。 





如 果 有 多 个 判断 条 件 ， 而 且 需 要 根据 这 些 判断 条 件 的 组 合 执行 某 些 
操作 ， 则 可 以 使 用 if/else if/else， 语 法 是 : 





if( 条 件 1){ 
代码 块 1 

}else if( 条 件 2){ 
代码 块 2 





PF 
else if( 条 件 n)f{ 
代码 块 n 

}elsef{ 
代码 块 n+1 
} 








if/else if/else 也 比较 人 简单， 但 可 以 表达 复杂 的 条 件 执行 逻辑 ， 它 逐个 
检查 条 件 ， 条 件 1 满足 则 执行 代码 块 1， 不 满足 则 检查 条 件 2，.………. ， 最 
后 如 果 没 有 条 件 满足 ， 且 有 else 语 句 ， 则 执行 else 里 面 的 代码 。 最 后 的 
else 语 句 不 是 必需 的 ， 没 有 就 什么 都 不 执行 。 


if/else ifyelse 陷 阱 : 需要 注意 的 是 ， 在 ifgelse if/else 中 ， 判 断 的 
是 很 重要 的 ， 后 面 的 判断 只 有 在 前 面 的 条 件 为 false 的 时 候 才 会 执行 


初学 者 有 时 会 搞 错 这 个 顺序 ， 如 下 面 的 代码 : 











if(score>69)1 
return "及 格 "， 
}else if(score>80){ 
return " 民 好 "， 
}elsef{ 
return "优秀 " 
} 








看 出 问题 了 吧 ? 如 果 score 是 90， 可 能 期 望 返回 “优秀 >”， 但 实际 只 会 
返回 “及 格 ”。 


在 if/else if/else 中 ， 如 果 判 断 的 条 件 基于 的 是 同一 个 变量 ， 只 是 根据 
变量 值 的 不 同 而 有 不 同 的 分 支 ， 如 果 值 比较 多 ， 比 如 根据 星期 几 进 行 判 
断 ， 有 7 种 可 能 性 ， 或 者 根据 英文 字母 进行 判 晰 ， 有 26 种 可 能 性 ， 使 用 
if/else if/else 比 较 烦 琐 ， 这 种 情况 可 以 使 用 switch， 话 法 是 : 

















switch( 表 达 式 ){ 
case 值 1: 


代码 1; break; 
case 值 2: 
代码 2; break; 


case 值 n: 
代码 n; break; 
default: 代码 n+1 








switch 也 比较 简单 ， 根 据 表达 式 的 值 执行 不 同 的 分 文 ， 有 具体 来 说 ， 
根据 表达 式 的 值 找 匹配 的 case， 找 到 后 执行 后 面 的 代码 ， 们 到 break 时 结 
束 ， 如 果 没 有 找到 匹配 的 值 则 执行 default 后 的 语句 。 表 达 式 值 的 数据 类 
型 只 能 是 byte、short、int、char、 枚 举 和 String (Java 7 以 后 ) 。 枚 举 和 
String 我 们 在 后 续 章节 介绍 。 


switch 会 简化 一 些 代 码 的 编写 ， 但 break 和 case 语 法 会 给 初学 者 造成 
一 些 困 惑 。 





break 是 指 跳出 switch 语 句 ， 执 行 switch 后 面 的 语句 。 每 条 case 语 句 后 
面 都 应 该 跟 break 语 句 ， 否 则 会 继续 执行 后 面 case 中 的 代码 直到 磁 到 break 
语句 或 switch 结 束 。 比 如 ， 下 面 的 代码 会 输出 所 有 数字 而 不 只 是 1。 





int a = 1; 

Switch(a){ 

case 1: 
System.out.printlin("1"); 

case 2: 
System,.out.printlin("2"),; 

default: 
System,.out.printlin("3"),; 

} 





case 语 名 后 面 可 以 没有 要 执行 的 代码 ， 如 下 所 示 : 





char c = 'A'; // 某 字符 


Switch(c){ 
case 'A': 
case 'B': 
Case 'C': 
System,.out.printin("A-2Z");break; 
case 'D': 
} 





case'A''B' 后 都 没有 紧 跟 要 执行 的 代码 ， 它 们 实际 会 执行 第 一 块 碰 到 


的 代码 ， 即 case'C' 匹 配 的 代码 。 


简单 总 结 下 ， 条 件 执行 总 体 上 是 比较 简单 的 : 单一 条 件 满 足 时 ， 执 
行 某 操 作 使 用 过， 根据 一 个 条 件 是 否 满足 执行 不 同 分 支 使 用 if/else; 表达 
复杂 的 条 件 使 用 itelse if/else; 条 件 赋值 使 用 三 元 运算 符 ， 根 据 某 一 个 表 
达 式 的 值 不 同 执 行 不 同 的 分 支 使 用 switch。 


从 逻辑 上 讲 ，if/else、if/else if/else、 三 元 运算 符 、switch 都 可 以 只 用 
计 代 蔡 ， 但 使 用 不 同 的 语法 表达 更 简洁， 在 条 件 比 较 多 的 时 候 ，switch 
从 性 能 上 看 也 更 高 〈 稍 后 解释 原因 ) 。 








1.4.2 ”实现 原理 








条 件 执行 具体 是 怎么 实现 的 呢 ? 程序 最 终 痢 是 一 条 条 的 指令 ，CPU 
有 一 个 指令 指示 器 ， 指 癌 下 一 条 要 执行 的 指令 ，CPU 根 据 指示 履 的 指示 
加 载 指令 并 且 执 行 。 指 令 大 部 分 是 具体 的 操作 和 运算 ， 在 执行 这 些 操作 
时 ， 执 行 完 一 个 操作 后 ， 指 令 指 示 咒 会 目 动 指 癌 换 着 的 下 一 条 指令 。 

但 有 一 些 特殊 的 指令 ， 称 为 跳 转 指令 ， 这 些 指令 会 修改 指令 指示 右 
的 值 ， 让 CPU 跳 到 一 个 指定 的 地 方 执行 。 跳 转 有 两 种 ， 一 种 是 条 件 跳 
转 ; 奶 一 种 是 无 条 件 跳 转 。 条 件 跳 转 检查 某 个 条 件 ， 满 足 则 进行 跳 转 ， 
无 条 件 跳 转 则 是 直接 进行 跳 转 。 


if/else 实 际 上 会 转换 为 这 些 跳 转 指令 ， 比 如 下 面 的 代码 : 











1 int a=10,; 
if(a%2==0) 





2 
3 
4 System.out.println(" 偶 数 ")，; 
5 } 
6 / 





/其 他 代码 





转换 到 的 转移 指令 可 能 是 : 


int a=10， 


~ 


条 件 跳 转 ， 如 果 a%2==0, 跳 转 到 第 4 行 
无 条 件 跳 转 ， 跳 转 到 第 7 行 


1 
2 
3 
44 
5 
6 


} 





System.out.println(" 偶 数 ")， 











7 // 其 他 代码 














你 可 能 会 奇怪 第 3 行 的 无 条 件 跳 转 指令 ， 没 有 它 不 行 吗 ? 不 行 ， 没 
有 这 条 指令 ， 它 会 顺序 执行 接 下 来 的 指令 ， 导 致 不 管 什么 条 件 ， 揪 号 中 
的 代码 都 会 执行 。 不 过 ， 对 应 的 跳 转 指令 也 可 能 是 : 








1 int a=10,; 
2 条 件 跳 转 : 如 果 a%21=0, 跳 转 到 第 6 行 











3 荆 
4 System.out.printlLn(" 偶 数 " ) ; 
5 } 

6 // 其 他 代码 








这 里 就 没有 无 条 件 跳 转 指令 ， 有 具体 怎么 对 应 和 编译 器 实现 有 关 。 在 
单一 if 的 情况 下 可 能 不 用 无 条 件 跳 转 指令 ， 但 稍微 复杂 一 些 的 情况 都 需 
要 。if、if/else、if/else if/else、 三 元 运算 符 都 会 转换 为 条 件 跳 转 和 无 条 件 
跳 转 ， 但 switch 不 太一 样 。 


switch 的 转换 和 具体 系统 实现 有 关 。 如 采 分 文 比 较 少 ， 可 能 会 转换 
为 跳 转 指令 。 如 果 分 文 比 较 多 ， 使 用 条 件 跳 转 会 进行 很 多 次 的 比较 运 
算 ， 效 率 比 较 低 ， 可 能 会 使 用 一 种 更 为 高 效 的 方式 ， 叫 跳 转 表 。 跳 转 表 
征 一 个 映射 表 ， 存 储 了 可 能 的 值 以 及 要 跳 转 到 的 地 址 ， 如 表 1-5 所 示 。 








表 1-5” 跳 转 表 
条 件 值 跳 转 地 址 条 跳 转 地 址 
Tr 7 
值 2 代码 块 2 的 地 址 “|  ” 值 ” | 代码 块 » 的 地 址 





跳 转 表 为 什么 会 更 为 高 效 呢 ?因为 其 中 的 值 必 须 为 整数 ， 旦 按 大 小 
顺序 排序 。 按 大 小 排序 的 整数 可 以 使 用 高 效 的 二 分 查找 ， 即 先 与 中 间 的 
值 比 ， 如 果 小 于 中 间 的 值 ， 则 在 开始 和 中 间 值 之 间 找 ， 否 则 在 中 间 值 和 
末尾 值 之 间 找 ， 每 找 一 次 缩小 一 半 查 找 范 围 。 如 果 值 是 连续 的 ， 则 跳 转 
表 还 会 进行 特殊 优化 ， 优 化 为 一 个 数组 ， 连 找 都 不 用 找 了 ， 值 就 是 数组 
的 下 标 索引 ， 直 接 根据 值 就 可 以 找到 跳 转 的 地 址 。 即 使 值 不 是 连续 的 ， 
但 数字 比较 密集 ， 差 的 不 多 ， 编 译 器 也 可 能 会 优化 为 一 个 数组 型 的 跳 转 
表 ， 没 有 的 值 指向 default 分 支 。 


程序 源 代 码 中 的 case 值 排列 不 要 求 是 排序 的 ， 编 译 吉 会 目 动 排序 。 











之 前 说 switch 值 的 类 型 可 以 是 byte、short、int、char、 枚 举 和 String。 其 
中 byte/shorUint 本 来 就 是 整数 ，char 本 质 上 也 是 整数 〈2.4 节 介绍 ) ， 而 
枚 举 类 型 也 有 对 应 的 整数 (5.4 节 介绍 ) ，String 用 于 switch 时 也 会 转换 
为 整数 。 不 可 以 使 用 long， 为 什么 呢 ? 跳 转 表 值 的 存储 空间 一 般 为 32 
位 ， 容 纳 不 下 long。 简 单 说 明 下 String，String 是 通过 hashCode 方 法 〈7.2 
节 介绍 ) 转换 为 整数 的 ， 但 不 同 String 的 hashCode 可 能 相同 ， 跳 转 后 会 
再 次 根据 String 的 内 容 进 行 比 较 判 断 。 


简单 总 结 下 ， 条 件 执行 的 语法 是 比较 自然 和 容易 理解 的 ， 需 要 注意 
的 是 其 中 的 一 些 语法 细节 和 陷阱 。 它 执行 的 本 质 依赖 于 条 件 跳 转 、 无 条 
件 跳 转 和 跳 转 表 。 条 件 执 行 中 的 跳 转 只 会 跳 转 到 跳 转 语句 以 后 的 指令 ， 
能 不 能 跳 转 到 之 前 的 指令 呢 ? 可 以 ， 那 样 就 会 形成 循环 。 





所 谓 循 环 ， 就 是 多 次 重复 执行 茶 些 类 似 的 操作 ， 这 个 操作 一 般 不 是 
ee” 
， 0D: 


1) 展示 照片 ， 我 们 但 看 手机 上 的 照片 ， 背 后 的 程序 需要 将 照片 一 
张 张 展示 给 我 们 。 


人 
有 艳 。 


3) 查看 消息 ， 我 们 浏览 朋友 圈 消 息 ， 背 后 程序 将 消息 一 条 条 展示 
给 我 们 。 


人 循环 除了 用 于 重复 读 取 或 展示 某 个 列表 中 的 内 容 ， 日 常 中 的 很 多 操 
作 也 要 靠 循环 完成 ， 比 如 : 


1) 在 文件 中 ， 碍 找 茶 个 词 ， 程 序 需要 和 文件 中 的 词 逐个 比较 “〈 当 
然 可 能 有 更 高 效 的 方式 ， 但 也 离 不 开 循环 ) ; 


2) 使 用 Excel 对 数据 进行 汇总 ， 比 如 求 和 或 平均 值 ， 需 要 循环 处 理 
每 个 单元 的 数据 ; 


3) 群发 祝福 消 四 给 好 友 ， 程 序 需 要 循环 给 每 个 好 友 发 。 


当然 ， 以 上 这 些 例子 只 是 冰山 一 角 。 计 算 机 程序 运行 时 大 致 只 能 顺 
序 执行 、 条 件 执 行 和 循环 执行 。 顺 序 和 条 件 其 实 没什么 特别 的 ， 而 循环 
大 概 才 是 程序 强大 的 地 方 。 和 凭借 循环 ， 计 算 机 能 够 非常 高 效 地 完成 人 很 
难 或 无 法 完成 的 事情 。 比 如 ， 在 大 量 文 件 中 得 找 包含 某 个 搜索 词 的 文 
档 ， 对 几 十 万 条 销售 数据 进行 统计 汇总 等 。 下 面 ， 我 们 先 来 介绍 循环 的 
4 种 形式 ， 然 后 介绍 循环 控制 ， 最 后 讨论 循环 的 实现 原理 并 进行 总 结 。 














1.5.1 循环 的 4 种 形 却 


在 Java 中 ， 和 循环 有 4 种 形式 ， 分 别 是 while、do/while、for 和 foreach， 
下 面 我 们 分 别 介绍 。 








1.while 
while 的 语法 为 : 
while 的 语法 为 : 
while( 条 件 语句 ){ 
代码 
} 
或 : 





while( 条 件 语句 ) 代码 ; 





while 和 if 的 语法 很 像 ， 只 是 把 if 换 成 了 while， 它 表达 的 含义 也 非常 
La 就 一 直 执 行 后 面 的 代码 ， 为 假 束 停 止 不 做 
0: 








Scanner reader = new Scanner(System.in)， 

System.out.println("please input password"); 

int num = reader.nextInt(); 

int password = 6789 ; 

while(num!=password){ 
System.out.printlin("please input password"); 
num = reader .nextInt(); 

} 

System.out.println("correct"); 

reader .close( ); 





以 上 代码 中 ， 我 们 使 用 类 型 为 Scanner 的 reader 变 量 从 屏幕 控制 台 接 
收 数字 ，reader.nextInt 〈) 从 屏幕 接收 一 个 数字 ， 如 果 数 字 不 是 6789， 
了 怠 一 直 提 示 输 入 ， 人 否则 跳出 循环 。 以 上 代码 中 的 Scanner 我 们 会 在 13.3 节 
介绍 ， 目 前 可 以 忽略 其 细节 


while 循 环 中 ， 代 码 块 中 会 有 影 啊 循 环 中 断 或 退出 的 条 件 ， 但 经 秆 
不 知道 什么 时 候 循环 会 中 断 或 退出 。 比 如 ， 上 例 中 在 匹配 的 时 候 会 退 
出 ， 但 什么 时 候 能 匹配 取决 于 用 户 的 输入 。 


2.do/while 


如 果 不 管 条 件 语句 是 什么 ， 代 码 块 都 会 至 少 执行 一 次 ， 则 可 以 使 用 
do/while 循 环 ， 其 语法 为 : 








dof 


代码 块 ， 
}while (条件 语 句 ) 








这 个 也 很 容易 理解 ， 先 执行 代码 块 ， 然 后 再 判断 条 件 语 句 ， 如 果 成 
立 ， 则 继续 循环 ， 否 则 退出 循环 。 也 就 是 说 ， 不 管 条 件 语句 是 什么 ， 代 
码 块 都 会 至 少 执行 一 次 。 上 面 的 例子 ， 改 为 do/while 循 环 ， 代 码 为 : 





Scanner reader = new Scanner(System.in); 
int password = 6789 ; 
int num = 0; 
dof{ 
System,out .println("please input password"); 
num = reader ,nextInt() ; 
}while(num!=password); 
System.out.println("correct"); 
reader .close(); 





3.for 


实际 中 应 用 最 为 广泛 的 循环 语法 可 能 是 for 了 ， 尤 其 是 在 循环 次 数 已 
知 的 情况 。 其 语法 为 : 











for (初始 化 语句 ;循环 条 件 ; 步 进 操作 ) 
循环 体 
} 





for 后 面 的 括号 中 有 两 个 分 号 ; ， 分 隔 了 三 条 语句 。 除 了 循环 条 件 必 
须 返 回 一 个 boolean 类 型 外 ， 其 他 语句 没有 什么 要 求 ， 但 通常 情况 下 第 一 
条 语句 用 于 初始 化 ， 尤 其 是 循环 的 索引 变量 ， 第 三 条 语句 修改 循环 变 
量 ， 一 般 是 步 进 ， 即 递增 或 递减 案 引 变量 ,循环 体 是 在 循环 中 执行 的 语 











for 循 环 简化 了 书写 ， 但 执行 过 程 对 初学 者 而 言 不 是 那么 明显 ， 实 际 
上 ， 它 执行 的 流程 如 下 : 


1) 执行 初始 化 指令 ; 

2) 检查 循环 条 件 是 否 为 tue， 如 果 为 false， 则 跳 转 到 第 6 步 ; 
3) 循环 条 件 为 真 ， 执 行 循环 体 ; 

4) 执行 步 进 操作 ; 

5) 步 进 操 作 执 行 完 后 ， 跳 转 到 第 2 步 ， 即 继续 检查 循环 条 件 ; 
6) for 循 环 后 面 的 语句 。 

下 面 是 一 个 简单 的 for 循 环 : 





int[] arr = {1,2,3,4}; 
for(int i=0; i<arr.length; i++){ 
System,out.println(arr[I])， 


} 





顺序 打印 数组 中 的 每 个 元 系 ， 初 始 化 语句 初始 化 案 引 i 为 0， 循 环 条 
件 为 索引 小 于 数组 长 度 ， 步 进 操 作为 递增 案 引 ij， 循环 体 打印 数组 元 
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在 for 中 ， 每 条 语句 都 是 可 以 为 空 的 ， 也 惑 是 说 : 





for(;;){} 





是 有 效 的 ， 这 是 个 死 循环 ， 一 直 在 空转 ， 和 while (true〉{} 的 效果 
是 一 样 的 。 可 以 省 略 某 些 语 句 ， 但 分 号 ;不 能 省 。 如 : 





int[] arr = {1,2,3,4}; 

int i=0; 

for(; i<arr.length; i++){ 
System,out.println(arr[I])， 


} 





索引 变量 在 外 面 初始 化 了 ， 上 所 以 初始 化 语句 可 以 为 空 。 


4.foreach 


foreach 的 语法 如 下 所 示 : 





int[] arr = {1,2,3,4}; 
for(int element : arr){ 
System,out.println(element ) ， 


} 





foreach 不 是 一 个 关键 字 ， 它 使 用 冒 写 : ， 冒 号 前 面 是 循环 中 的 每 个 
元 素 ， 包 括 数 据 类 型 和 变量 名 称 ， 冒 号 后 面 是 要 授 历 的 数组 或 集合 (第 
9 章 介 绍 ) ， 每 次 循环 element 都 会 目 动 更 新 。 对 于 不 需要 使 用 索引 变 
量 ， 只 是 简单 遍历 的 情况 ，foreach 语 法 上 更 为 简洁 。 





1.5.2 ”循环 控制 


在 循环 的 时 候 ， 会 以 循环 条 件 作为 是 否 结束 的 依据 ， 但 有 时 可 能 会 
需要 根据 别 的 条 件 提前 结束 循环 或 跳 过 一 些 代 码 ， 这 时 可 以 使 用 break 
或 continue 关 键 字 对 循环 进行 控制 。 


1.break 


break 用 于 提前 结束 循环 。 比 如 ， 在 一 个 数组 中 查找 某 个 元 素 的 时 
候 ， 循 环 条 件 可 能 是 到 数组 结束 ， 但 如 果 找 到 了 元 素 ， 可 能 就 会 想 提 前 
结束 循环 ， 这 时 就 可 以 使 用 break。 


我 们 在 介绍 switch 的 时 候 提 到 过 break， 它 用 于 跳 转 到 switch 外 面 。 
在 循环 的 循环 体 中 也 可 以 使 用 break， 它 的 含义 和 switch 中 的 类 似 ， 用 于 
开始 执行 循环 后 面 的 语句 。 以 在 数组 中 查找 元 素 作 为 例子 ， 
人 码 可 能 是 : 








int[] arr = ..; // 在 该 数组 中 查找 元 素 
int toSearch = 100; // 要 查找 的 元 素 
int i = 0; 
for(; i<arr.length; i++){ 
if(arr[i]==toSearch)t{ 
break; 
} 


} 
if(i!=arr.length)t{ 

System,out .println("found") ; 
}elsef{ 

System.out.printlin("not found"); 





如 果 找 到 了 ， 会 调用 break，break 执 行 后 会 跳 转 到 循环 外 面 ， 不 会 
再 执行 这 + 语句 ， 所 以 即使 是 最 后 一 个 元 素 匹 配 ，i 也 小 于 arr.length， 而 
如 果 没 有 找到 ，i 最 后 会 变 为 arr.length， 所 以 可 根据 i 是 否 等 于 arr.length 
来 判断 是 否 找到 了 。 以 上 代码 中 ， 也 可 以 将 判断 是 否 找到 的 检查 放 到 循 
环 条 件 中 ， 但 通常 情况 下 ， 使 用 break 会 使 代码 更 清楚 一 些 。 





2.continue 


在 循环 的 过 程 中 ， 有 的 代码 可 能 不 需要 每 次 循环 都 执行 ， 这 时 候 ， 
可 以 使 用 continue 语 句 ，continue 语 句 会 跳 过 循环 体 中 剩 下 的 代码 ， 然 后 
我 们 看 个 例子 ， 以 下 代码 统计 一 个 数组 中 某 个 元 素 的 个 








int[] arr = .… // 在 该 数组 中 查找 元 素 
int toSearch = 2; // 要 查找 的 元 素 
int count = 0; 
for(int i=0; i<arr.length; i++){ 
if(arr[i]!=toSearch)t{ 
continue,; 




















Count++; 


System.out.println("found count "+count); 





上 面 的 代码 统计 数组 中 值 等 于 toSearch 的 元 素 个 数 ， 如 果 值 不 等 于 
toSearch， 则 跳 过 剩 下 的 循环 代码 ， 执 行 +t+。 以 上 代码 也 可 以 不 用 
continue， 使 用 相反 的 让 判断 也 可 以 得 到 相同 的 结果 。 这 只 是 个 人 偏好 的 
问题 ， 如 果 类 似 要 跳 过 的 情况 比较 多 ， 使 用 continue 可 能 会 更 易 读 。 


1.5.3 ”实现 原理 


和 让 一 样 ， 循 环 内 部 也 是 徘 条 件 转移 和 无 条 件 转 移 指 令 实 现 的 ， 比 
如 下 面 的 代码 : 


int[] arr = {1,2,3,4}; 
for(int i=0; i<arr.length; i++){ 
System,out.println(arr[I])， 





其 对 应 的 跳 转 过 程 可 能 为 : 





1 int[] arr = {1,2,3,4}; 

2 int i=0; 

3 条 件 跳 转 ， 如果 i>=arr .length， 跳 转 到 第 7 行 
4 System.out.println(arr[i]); 


5 i++ 
6 无 条 件 跳 转 ， 跳 转 到 第 3 行 
7 其 他 代码 








在 寺中， 跳 转 只 会 往 后 面 跳 ， 而 for 会 往 前 面 跳 ， 第 6 行 就 是 无 条 件 
跳 转 指令 ， 跳 转 到 了 前 面 的 第 3 行 。break/continue 语 句 也 都 会 转换 为 跳 
转 指 令 ， 上 具体 束 不 葡 述 了 。 


1 5 外 结 


循环 的 语法 总 体 上 也 是 比较 简单 的 ， 初 学 者 需要 注意 的 是 for 的 执行 
过 程 ， 以 及 break 和 continue 的 含义 。 虽 然 循环 看 起 来 只 是 重复 执行 一 些 
类 似 的 操作 而 已 ， 但 它 其 实 是 计算 机 程序 解决 问题 的 一 种 基本 思维 方 
式 ， 和 凭借 循环 〈 当 然 还 有 别 的 ) ， 计 算 机 程序 可 以 发 挥 出 强大 的 威 
力 ， 比 如 批量 转换 数据 、 碍 找 过 滤 数 据 、 统 计 汇 总 等 。 


使 用 基本 数据 类 型 、 数 组 、 基 本 运算 ， 加 上 条 件 和 循环 ， 其 实 已 经 
可 以 写 很 多 程序 了 ， 但 这 样 写 出 来 的 程序 往往 难以 理解 ， 尤 其 是 程序 罗 
辑 比 较 复 杂 的 时 候 。 


解决 复杂 问题 的 基本 人 策略 是 分 而 治之 ， 将 复杂 问题 分 解 为 行 干 相对 
简单 的 子 问题 ， 然 后 子 问 题 再 分 解 为 更 小 的 子 问 题 ..…. 程 序 由 数据 和 指 
令 组 成 ， 大 程序 可 以 分 解 为 小 程序 ， 小 程序 接 痢 分 解 为 更 小 的 程序 。 那 
如 何 表 示 子 程序 ， 以 及 子 程序 之 间 如 何 协 调 呢 ? 我 们 下 节 介 绍 。 














1.6 ”函数 的 用 法 


如 宁 需 要 经 闻 做 茶 一 种 操作 ， 则 关 似 的 代码 需要 重复 写 很 多 届 。 比 
如 在 一 个 数组 中 得 找 某 个 数 ， 第 一 次 碍 找 一 个 数 ， 第 二 次 可 能 得 找 另 一 
个 数 ， 每 得 一 个 数 ， 类 似 的 代码 都 需要 重 写 一 过 ， 很 罗 唆 。 另 外 ， 有 一 
i 
年 和 维护 。 


计算 机 程序 使 用 函数 这 个 概念 来 解决 这 个 问题 ， 即 使 用 函数 来 减少 
重复 代码 和 分 解 复 杂 操 作 。 本 节 我 们 就 来 谈 谈 Java 中 的 函数 ， 包 括 函 数 
的 基本 概念 和 一 些 细 市 ， 下 贡 我 们 讨论 函数 的 基本 实现 原理 。 











1.6.1 基本 概念 





函数 这 个 概念 ， 我 们 学 数学 的 时 候 都 接触 过 ， 其 基本 格式 是 
y=f (x) ， 表 示 的 是 x 到 y 的 对 应 关系 ， 给 定 输 入 XxX， 经 过 函数 变换 f， 输 
出 y。 程 序 中 的 函数 概念 与 其 类 似 ， 也 由 输入 、 操 作 和 输出 组 成 ， 但 它 
表示 的 是 一 段子 程序 ， 这 个 子 程 序 有 一 个 名 字 ， 表 示 它 的 目的 (类 比 
f) ， 有 和 零 个 或 多 个 参数 (类 比 x) ， 有 可 能 返回 一 个 结果 (类 比 y) 。 
我 们 来 看 两 个 简单 的 例子 : 











public static int sum(int a, int b){ 
int sum = a + b; 
return sum; 
} 
public static void print3Lines(){ 
for(int i=0;i<3;i++){ 
System.out.println()， 


} 


第 一 个 函数 的 名 字 叫 做 sum， 它 的 目的 是 对 输入 的 两 个 数 求 和 ， 有 
两 个 输入 参数 ， 分 别 是 int 整 数 a 和 b， 它 的 操作 是 对 两 个 数 求 和 ， 求 和 结 
果 放 在 变量 sum 中 〈 这 个 sum 和 函数 名 字 的 sum 没 有 任何 关系 ) ， 然 后 使 
用 return 语 句 将 结果 返回 ， 最 开始 的 public static 是 函数 的 修饰 答 ， 我 们 
后 续 介 绍 。 





第 二 个 函数 的 名 字 叫 做 print3Lines， 它 的 目的 是 在 屏幕 上 输出 三 个 
回 值 。 


以 上 代码 都 比较 简单 ， 主 要 是 演示 函数 的 基本 语法 结构 ， 即 : 














修饰 符 返回 值 类 型 ”函数 名 字 ( 参 数 类 型 参数 名 字 ，…) 荆 
操作 











return 返回 值 ， 





} 





函数 的 主要 组 成 部 分 有 以 下 几 种 。 
1) 函数 名 字 : 名 字 是 不 可 或 缺 的 ， 表 示 函 数 的 功能 。 


0 0 00 600 606 
字 组 成 。 


3) 操作 : 函数 的 具体 操作 代码 。 


4) 返回 值 : 函数 可 以 没有 返回 值 ， 如 果 没 有 返回 值 则 类 型 写成 
void， 如 有 果 有 则 在 函数 代码 中 必须 使 用 return 语 句 返 回 一 个 值 ， 这 个 值 的 
类 型 需要 和 声明 的 返回 值 类 型 一 致 。 


5) 修饰 行 ，Java 中 函数 有 很 多 修饰 符 ， 分 别 表示 不 同 的 目的 ， 本 
节 假 定 修饰 符 为 public static， 且 暂 不 讨论 这 些 修饰 符 的 目的 。 


以 上 束 是 定义 函数 的 语法 。 定 义 函 数 束 是 定义 了 一 段 有 着 明确 功能 
的 子 程序 ， 但 定义 函数 本 喘 不 会 执行 任何 代码 ， 函 数 要 被 执行 ， 震 要 被 
调用 。 


Java 中 ， 任 何 函数 都 需要 放 在 一 个 类 中 。 类 还 没有 介绍 ， 我 们 暂时 
可 以 把 类 看 作 函 数 的 一 个 容器 ， 即 函数 放 在 类 中 ， 类 中 包括 多 个 函数 ， 
Java 中 的 函数 一 般 叫 做 方法 ， 我 们 不 特别 区 分 函数 和 方法 ， 可 能 会 交 
丛 使 用 。 一 个 类 里 面 可 以 定义 多 个 函数 ， 类 里 面 可 以 定义 一 个 叫做 main 
的 函数 ， 形 式 如 : 














public static void main(String[] args) { 





这 个 函数 有 特殊 的 含义 ， 表 示 程 序 的 入 口 ，String[]args 表 示 从 控制 
台 接 收 到 的 参数 ， 我 们 暂时 可 以 忽略 它 。Java 中 运行 一 个 程序 的 时 候 ， 
需要 指定 一 Do 数 的 类 ，Java 会 寻找 main 函 数 ， 并 从 main 函 
数 开 始 执行 


刚 开 始 学 编程 的 人 可 能 会 误 以 为 程序 从 代码 的 第 一 行 开始 执行 ， 这 
错误 的 ， 0 数 定义 在 哪里 ，Java 函 数 都 会 先 找 到 它 ， 然 后 从 
人 行 开 始 执行 


main 函 数 中 除了 可 以 定义 变量 ， 操 作 数据 ， 还 可 以 调用 其 他 函 
数 ， 如 下 所 示 : 


public static void main(String[] args) { 
int a = 2) 
int b = 3; 
int sum = sum(a, b); 
System.out.printilin(sum); 
print3Lines(); 
System.out.println(sum(3,4)); 





调用 函数 需要 传递 参数 并 处 理 返 回 值 。main 函 数 首 和 完 定 义 了 两 个 变 
量 a 和 b， 接 着 调用 了 函数 sum， 并 将 a 和 b 传 递 给 了 了 sum 函数 ， 然 后 将 sum 
的 结果 赋值 给 了 变量 sum。 


这 里 初学 者 需要 注意 的 是 ， 参 数 和 返回 值 的 名 字 是 没有 特别 含义 
的 。 调 用 者 main 中 的 参数 名 字 a 和 b， 和 函数 定义 sum 中 的 参数 名 字 a 和 Pb 
只 是 碰巧 一 样 而 已 ， 它 们 完全 可 以 不 一 样 ， 而 且 名 字 之 间 没 有 关系 ， 
sum 函 数 中 不 能 使 用 main 函 数 中 的 名 字 ， 反 之 也 一 样 。 调 用 者 main 中 的 
sum 变 量 和 sum 函 数 中 的 sum 变量 的 名 字 也 是 全 巧 一 样 而 已 ， 完 全 可 以 不 
一 样 。 另 外 ， 变 量 和 函数 可 以 取 一 样 的 名 字 ， 但 一 样 不 代表 有 特别 的 含 
义 。 








调用 函数 如 果 没 有 参数 要 传递 ， 也 要 加 括号 〈) ， 如 
print3Lines () 。 

传递 的 参数 不 一 定 是 个 变量 ， 可 以 是 常量 ， 也 可 以 是 某 个 运算 表达 
式 ， 可 以 是 某 个 函数 的 返回 结果 。 比 如 :， System.out.printin (sum (3， 








4) ) ; ， 第 一 个 函数 调用 sum (3，4) ， 传 递 的 参数 是 常量 3 和 4， 第 二 
个 函数 调用 System.out.printtn 传 递 的 参数 是 sum (3，4) 的 返回 结果 。 


关于 参数 传递 ， 简 单 总 结 一 下 ， 定 义 函 数 时 声明 参数 ， 实 际 上 就 是 
定义 变量 ， 只 是 这 些 变 量 的 值 是 未 知 的 ， 调 用 函数 时 传递 参数 ， 实 际 上 
束 是 给 函数 中 的 变量 赋值 。 


A 
数 ， 比 如 : 





int a = 23; 
System,out.println(Integer,toBinaryString(a) )， 


调用 Integer 类 中 的 toBinaryString 函 数 ，toBinaryString 是 Integer 类 中 
修饰 符 为 public static 的 函数 ， 表 示 输 出 一 个 整数 的 二 进 制 表示 。 


对 于 需要 重复 执行 的 代码 ， 可 以 定义 函数 ， 然 后 在 需要 的 地 方 调 
用 ， 这 样 可 以 减少 重复 代码 。 对 于 复杂 的 操作 ， 可 以 将 操作 分 为 多 个 函 
数 ， 会 使 得 代码 更 加 易 读 。 


我 们 知道 ， 程 序 执行 基本 上 只 有 顺序 执行 、 条 件 执行 和 循环 执行 ， 
但 更 完整 的 描述 应 该 包括 函数 的 调用 过 程 。 程 序 从 main 函 数 开 始 执行 ， 
合 到 函数 调用 的 时 候 ， 会 跳 转 进 函数 内 部 ， 函 数 调用 了 其 他 函数 ， 会 接 
着 进入 其 他 函数 ， 函 数 返回 后 会 继续 执行 调用 后 面 的 语句 ， 返 回 到 main 
函数 并 且 main 函 数 没有 要 执行 的 语句 后 程序 结束 。1.7 市 会 更 深入 地 介 
绍 执行 过 程 细 市 。 在 Java 中 ， 阴 数 在 程序 代码 中 的 位 置 和 实际 执行 的 顺 
序 是 没有 关系 的 。 

















1.6.2 ”进一步 理解 函数 





函数 的 定义 和 基本 调用 应 该 是 比较 容易 理解 的 ， 但 有 很 多 细节 可 能 
仿 倪 着 困 恶 ， 包 括 参 数 传递 、 人 退回 、 函 数 命名 、 调 用 过 程 污 ， 我 们 连 
介绍 。 


1. 参 数 传递 
有 两 类 特殊 类 型 的 参数 : 数组 和 可 变 长 度 的 参数 。 





(1) 数组 


数组 作为 参数 与 基本 类 型 是 不 一 样 的 ， 基 本 类 型 不 会 对 调用 者 中 的 
变量 造成 任何 影响 ， 但 数组 不 是 ， 在 函数 内 修改 数组 中 的 元 和 聚会 修改 调 
用 者 中 的 数组 内 容 。 我 们 看 个 例子 : 








public static void reset(int[] arr){ 
for(int i=0;i<arr.length;i++){ 
arr[i] = i; 
} 
} 
public static void main(String[] args) { 
int[] arr = {10,20,30,40}; 
reset(arr); 
for(int i=0;i<arr.length;i++){ 
System.out.printin(arr[i]); 





在 reset 函 数 内 给 参数 数组 元 素 赋值 ， 在 main 函 数 中 数组 arr 的 值 也 会 


八 
V 


这 个 其 实 也 容易 理解 ， 我 们 在 1.2 节 介绍 过 ， 一 个 数组 变量 有 两 块 
空间 ， 一 块 用 于 存储 数组 内 容 本 里 ， 为 一 块 用 于 存储 内 容 的 位 置 ， 给 数 
组 变量 赋值 不 会 影响 原 有 的 数组 内 容 本 映 ， 而 只 会 让 数组 变量 指 疝 一 个 
不 同 的 数组 内 容 空 间 。 


在 上 例 中 ， 函 数 参 数 中 的 数组 变量 arr 和 main 函 数 中 的 数组 变量 arr 
存储 的 都 是 相同 的 位 置 ， 而 数组 内 容 本 里 只 有 一 份 数 据 ， 所 以 ， 在 reset 
中 修改 数组 元 素 内 容 和 在 main 中 修改 是 完全 一 样 的 。 


(2) 可 变 长 度 的 参数 
前 面 介绍 的 函数 ， 参 数 个 数 都 是 固定 的 ， 但 有 时 候 可 能 和 希望 参数 个 


数 不 是 固定 的 ， 比 如 求 在 干 个 数 的 最 大 值 ， 可 能 是 两 个 ， 也 可 能 是 多 
个 。Java 文 持 可 变 长 度 的 参数 ， 如 下 例 所 未 : 














public static int max(int min, int ... a)t{ 
int max = min; 
for(int i=0;i<a.length;i++)f{ 
if(max<a[i]){ 
max = a[il]; 


return max 


public static void main(String[] args) { 
System.out.printin(max(0)); 
System.out.printljn(max(0,2)); 
System.out.printlin(max(0,2,4)); 
System.out.printin(max(0,2,4,5)); 

} 








这 个 max 函 数 接受 一 个 最 小 值 ， 以 及 可 变 长 度 的 在 干 参数 ， 返 回 其 
中 的 最 大 值 。 可 变 长 度 参 数 的 语法 是 在 数据 类 型 后 面 加 三 个 点 “…”， 在 
函数 内 ， 可 变 长 度 参数 可 以 看 作 是 数组 。 可 变 长 度 参 数 必须 是 参数 列表 
中 的 最 后 一 个 ， 一 个 函数 也 只 能 有 一 个 可 变 长 度 的 参数 。 


可 变 长 度 参数 实际 上 会 转换 为 数组 参数 ， 也 就 是 说 ， 函 数 声明 
max (int min，int...a) 实际 上 会 转换 为 max (int min，int[Ja)， 在 main 
函数 调用 max (0，2，4，5) 的 时 候 ， 实 际 上 会 转换 为 调用 max (0， 
new int[]{2，4，5}) ， 使 用 可 变 长 度 参数 主要 是 简化 了 代码 书写 。 


2. 理 解 返 回 


对 初学 者 ， 我 们 强调 下 retum 的 含义 。 函 数 返 回 值 类 型 为 void 时 ， 
returmn 丰 是 必需 的 ， 在 没有 return 的 情况 下 ， 会 执行 到 函数 结尾 自动 返 
回 。retum 用 于 显 式 结束 函数 执行 ， 返 回调 用 方 。 


returmn 可 以 用 于 函数 内 的 任意 地 方 ， 可 以 在 函数 结尾 ， 也 可 以 在 中 
调用 方 。 


函数 返回 值 类 型 为 void 也 可 以 使 用 return， 即 “return; ”， 不 用 带 
值 ， 含 义 是 返回 调用 方 ， 只 是 没有 返回 值 而 已 。 


函数 的 返回 值 最 多 只 能 有 一 个 ， 那 如 果实 际 情况 需要 多 个 返回 值 
呢 ? 比如 ， 计 算 一 个 整数 数组 中 的 最 大 的 前 三 个 数 ， 需 要 返回 三 个 结 
果 。 这 个 可 以 用 数组 作为 返回 值 ， 在 函数 内 创建 一 个 包含 三 个 元 素 的 数 
组 ， 然 后 将 前 三 个 结果 赋 给 对 应 的 数组 元 素 。 


如 琳 实 际 情况 需要 的 返回 值 是 一 种 复合 结果 呢 ? 比 如 ， 会 找 一 个 字 
符 数 组 中 所 有 重复 出 现 的 字符 以 及 重复 出 现 的 次 数 。 这 个 可 以 用 对 象 作 
为 返回 值 ， 我 们 在 第 3 章 介绍 类 和 对 象 。 虽 然 返 回 值 最 多 只 能 有 一 个 ， 














但 其 实 一 个 也 够 了 。 
3. 重 复 的 命名 


每 个 函数 部 有 一 个 名 字 ， 这 个 名 字 表 示 这 个 函数 的 意义 ， 名 字 可 以 
重复 吗 ? 在 不 同 的 类 里 ， 答 案 是 肯定 的 ， 在 同一 个 类 里 ， 要 看 情况 。 


同一 个 类 里 ， 函 数 可 以 重 名 ,但 是 参数 不 能 完全 一 样 ， 即 要 么 参数 
个 数 不 同 ， 要 么 参数 个 数 相 同 但 至 少 有 一 个 参数 类 型 不 一 样 。 


同一 个 类 中 函数 名 相同 但 参数 不 同 的 现象 ， 一 般 称 为 函数 重 载 。 
为 什么 需要 函数 重 载 呢 ?一 般 是 因为 函数 想 表 达 的 意义 是 一 样 的 ， 但 参 
数 个 数 或 类 型 不 一 样 。 比 如 ， 求 两 个 数 的 最 大 值 ， 在 Java 的 Math 库 中 囊 
定义 了 4 个 函数 ， 如 下 所 示 : 











public static double max(double a, double b) 
public static float max(float a, float b) 
public static int max(int a, int b) 

public static long max(long a, long b) 





4. 调 用 的 匹配 过 程 


在 之 前 介绍 函数 调用 的 时 候 ， 我 们 没有 特别 说 明 参 数 的 类 型 。 这 里 
说 明 一 下 ， 参 数 传递 实际 上 是 给 参数 赋值 ， 调 用 者 传递 的 数据 需要 与 图 
数 声 明 的 参数 类 型 是 匹配 的 ， 但 不 要 求 完 全 一 样 。 什 么 意思 呢 ? Java 编 
译 嚣 会 日 动 进行 类 型 转换 ， 并 寻找 最 匹配 的 函数 ， 比 如 : 








char a = 'a'; 
char b = 'b'; 
System,.out.println(Math.max(a,b)); 





参数 是 字符 类 型 的 ， 但 Math 并 没有 定义 针对 字符 类 型 的 max 函 数 ， 
这 是 因为 char 其 实 是 一 个 整数 〈 我 们 在 2.4 节 会 说 明 ) ，Java 会 自动 将 
char 转 换 为 int， 然 后 调用 Math.max (inta，intb) ， 屏 幕 会 输出 整数 结 
果 98。 


如 果 Math 中 没有 定义 针对 int 类 型 的 max 函 数 呢 ?调用 也 会 成 功 ， 会 
调用 long 类 型 的 max 函 数 。 如 果 long 也 没有 呢 ? 会 调用 float 型 的 max 函 





数 。 如 果 float 也 没有 ， 会 调用 double 型 的 。Java 编 译 器 会 自动 寻找 最 匹 
配 的 。 


在 只 有 一 个 函数 的 情况 下 ， 即 没有 重 载 ， 只 要 可 以 进行 类 型 转换 ， 
就 会 调用 该 函数 ， 在 有 函数 重 载 的 情况 下 ， 会 调用 最 匹配 的 函数 。 


5. 递 归 函 数 


函数 大 部 分 情况 下 都 是 被 别 的 函数 调用 的 ， 但 其 实 函 数 也 可 以 调用 
它 自 己 ， 调 用 自己 的 函数 就 叫 递归 函数 。 为 什么 需要 自己 调用 自己 
呢 ? 我 们 来 看 一 个 例子 ， 求 一 个 数 的 阶乘 ， 数 学 中 一 个 数 n 的 阶乘 ， 表 
示 为 n! ， 它 的 值 定义 是 这 样 的 : 


0! =1 
n! = (n-1) ! xn 


0 的 阶乘 是 1，n 的 阶乘 的 值 是 n-1 的 阶乘 的 值 乘 以 n， 这 个 定义 是 一 
个 递归 的 定义 ， 为 求 n 的 值 ， 需 移 求 n-1 的 值 ， 直 到 0， 然 后 依次 往 回 
退 。 用 圳 归 表 达 的 计算 用 递归 函数 容易 实现 ， 代 码 如 下 : 


public static long factorial(int n){ 
if(n==0){ 
return 1; 
}elsef{ 
return n*factorial(n-1); 
} 
} 





看 上 去 应 该 是 比较 容易 理解 的 ， 和 数学 定义 类 似 。 递 归 函 数 形式 上 
往往 比较 简单 ， 但 递归 其 实 是 有 开销 的 ， 而 且 使 用 不 当 ， 可 能 会 出 现 意 
外 的 结果 ， 比 如 说 这 个 调用 : 





System,.out.println(factorial(100000)); 





系统 并 不 会 给 出 任何 结果 ， 而 会 抛 出 异常 。 异 常 我 们 在 第 6 章 介 
绍 ， 此 处 理解 为 系统 错误 就 可 以 了 。 异 常 类 型 为 
java.lang.StackOverflowError， 这 是 什么 意思 呢 ? 这 表示 栈 洲 出 错误 ， 要 
理解 这 个 错误 ， 我 们 需要 理解 函数 调用 的 实现 原理 ， 我 们 1.7 节 介绍 。 





那 北 归 不 可 行 的 情况 下 怎么 办 呢 ? 递 归 函 数 经 常 可 以 转换 为 非 递 归 
的 形式 ,， 通过 循环 实现 。 比 如 ， 求 阶乘 的 例子 ， 其 非 递 归 形 式 的 定义 


下 
n! =1x2x3x...xn 


这 个 可 以 用 循环 来 实现 ， 代 码 如 下 : 





public static long factorial(int n){ 
long result = 1; 
for(int i=1; i<=Nn; i++){ 
result=result*i; 


return result,; 
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函数 是 计算 机 程序 的 一 种 重要 结构 ， 通 过 函数 来 减少 重复 代码 、 分 
解 复杂 操作 是 计算 机 程序 的 一 种 重要 思维 方式 。 本 节 我 们 介绍 了 函数 
的 基础 概念， 以 及 关于 参数 传递 、 返 回 值 、 重 载 、 递 归 方 面 的 一 些 细 


在 Java 中 ， 函 数 还 有 大 量 的 修饰 符 ， 如 public、Pprivate、static、 
final、synchronized、abstract 等 ， 本 节 假 定 函数 的 修饰 符 都 是 public 
static， 在 后 续 章节 中 ， 我 们 再 介绍 这 些 修饰 符 。 函 数 中 还 可 以 声明 异 
常 ， 我 们 也 到 第 6 章 再 介绍 。 


1.7 ”函数 调用 的 基本 原理 


在 介绍 递归 函数 的 时 候 ， 我 们 看 到 了 一 个 系统 错误 : 
java.lang.StackOverflowError， 理 解 这 个 错误 ， 需 要 理解 函数 调用 的 实现 
机 制 。 下 面 ， 我 们 先 来 了 解 一 个 重要 的 概念 : 栈 ， 然 后 再 通过 一 些 例子 
来 仔细 分 析 函 数 调 用 的 过 程 。 


1.7.1 栈 的 概念 





我 们 之 前 谈 过 程序 执行 的 基本 原理 ， CPU 有 一 个 指令 指示 器 ， 指 向 
下 二 条 要 拓 行 的 指令 ， 要 么 顺 执 行 ， 要 么 进行 转 《条 件 中转 或 天 条 
跳 转 ) 。 


基本 上 ， 这 依然 是 成 立 的 ， 程 厅 从 main 函 数 开始 顺序 执行 ， 函 数 调 
用 可 以 看 作 一 个 无 条 件 跳 转 ， 跳 转 到 对 应 函数 的 指令 处 开始 执行 ， 碰 到 
retum 语 名 或 者 函数 结尾 的 时 候 ， 再 执行 一 次 无 条 件 跳 转 ， 路 转 回 调用 
方 ， 执 行 调用 函数 后 的 下 一 条 指令 。 


但 这 里 面 有 几 个 问题 。 

1) 参数 如 何 传递 ? 

2) 函数 如 何 知道 返回 到 什么 地 方 ? 在 if/else、for 中 ， 跳 转 的 地 址 都 
是 确定 的 ， 但 函数 自己 并 不 知道 会 被 谁 调用 ， 而 且 可 能 会 被 很 多 地 方 调 
用 ， 它 并 不 能 提前 知道 执行 结束 后 返回 哪里 。 

3) 函数 结果 如 何 传 给 调用 方 ? 

解决 轧 路 是 使 用 内 存 来 存放 这 些 数据 ， 函 数 调 用 方 和 函数 自己 就 如 


何 存放 和 使 用 这 些 数据 达成 一 个 一 致 的 协议 或 约定 。 这 个 约定 在 各 种 计 
算 机 系统 中 都 是 类 似 的 ， 存 放 这 些 数据 的 内 存 有 一 个 相同 的 名 字 ， 叫 栈 








栈 是 一 块 内 存 ， 但 它 的 使 用 有 特别 的 约定 ， 一 般 是 先进 后 出 ， 关 似 
于 一 个 桶 ， 往 栈 里 放 数 据 称 为 入 栈 ， 最 下 面 的 称 为 栈 克 ， 最 上 面 的 称 为 


栈 顶 ， 从 栈 顶 拿 出 数据 通 癌 称 为 出 栈 。 栈 一 般 是 从 高 位 地 址 癌 低 位 地 址 
扩展 ， 换 名 话说， 栈 底 的 内 存 地 址 是 最 高 的 ， 栈 项 的 是 最 低 的 。 


计算 机 系统 主要 使 用 栈 来 存放 函数 调用 过 程 中 需要 的 数据 ， 包 括 参 
数 、 返 回 地 址 ， 以 及 函数 内 定义 的 局 部 变量 。 计 算 机 系统 就 如 何在 栈 中 
存放 这 些 数 据 ， 调 用 者 和 函数 如 何 协 作 做 了 约定 。 返 回 值 不 太一 样 ， 它 
可 能 放 在 栈 中 ， 但 它 使 用 的 栈 和 局 部 变量 不 完全 一 样 ， 有 的 系统 使 用 
CPU 内 的 一 个 存储 器 存储 返回 值 ， 我 们 可 以 简单 认为 存在 一 个 专门 的 返 
回 值 存储 器 。main 函 数 的 相关 数据 放 在 栈 的 最 下 面 ， 每 调用 一 次 函数 ， 
都 会 将 相关 函数 的 数据 入 栈 ， 调 用 结束 会 出 栈 。 








1.7.2 ”函数 执行 的 基本 原理 


以 上 描述 可 能 有 点 抽象 ， 我 们 通过 一 个 例子 来 具体 说 明 函 数 执行 的 
过 程 ， 看 个 简单 例子 : 


1 public class Sum { 

2 

3 public static int sum(int a, int b) { 
4 int c=a+b 

5 return c; 

6 } 

7 

8 public static void main(String[] args) { 
9 int d = Sum.sum(1, 2); 

10 System.out.printin(d); 

11 } 

12 } 


这 是 一 个 简单 的 例子 ，main 函 数 调用 了 sum 函 数 ， 计 算 1 和 2 的 和 ， 
从 概念 上 ， 这 是 容易 理解 的 ， 让 我 们 从 栈 的 角度 来 
讨论 下 。 


当 程 序 在 main 函 数 调 用 Sum.sum 之 前 ， 栈 的 情况 大 概 如 图 1-1 所 示 。 


在 程序 执行 到 Sum.sum 的 函数 内 
部 ， 准 备 返 回 之 前 ， 即 第 5 行 ， 栈 的 情况 大 概 如 图 1-2 所 示 。 


我 们 解释 下 ， 在 main 函 数 调用 Sum.sum 时 ， 首 先 将 参数 1 和 2 入 栈 ， 
然后 将 返回 地 址 《也 就 是 调用 函数 结束 后 要 执行 的 指令 地 址 ) 入 栈 ， 接 





着 跳 转 到 sum 函数 ， 在 sum 函 数 内 部 ， 需 要 为 局 部 变量 c 分 配 一 个 空间 ， 
而 参数 变量 a 和 b 则 直接 对 应 于 入 栈 的 数据 1 和 2， 在 返回 之 前 ， 返 回 值 保 
存 到 了 专门 的 返回 值 存 储 器 中 。 


在 调用 retum 后 ， 程 序 会 跳 转 到 栈 中 保存 的 返回 地 址 ， 即 main 的 下 
一 条 指令 地 址 ， 而 sum 函 数 相关 的 数据 会 出 栈 ， 从 而 又 变 回 图 1-1 的 样 


子 。 
or | 
or | 
ome | au 


图 1-1 调用 Sum.sum 之 前 的 栈 示 意图 
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图 1-2 在 Sum.sum 内 部 ， 准 备 返 回 之 前 的 栈 示意 图 


main 的 下 一 条 指令 是 根据 函数 返回 值 给 变量 qd 赋值 ， 返 回 值 从 专门 
的 返回 值 存储 器 中 获得 。 





函数 执行 的 基本 原理 ， 简 单 来 说 就 是 这 样 。 但 有 一 些 需 要 介绍 的 
点 ， 我 们 讨论 一 下 。 


我 们 在 1.1 节 的 时 候 说 过 ， 定 义 一 个 变量 就 会 分 配 一 块 内 存 ， 但 我 
OD 
子 。 





从 以 上 关于 栈 的 描述 我 们 可 以 看 出 ， 函 数 中 的 参数 和 函数 内 定义 的 
变量 ， 都 分 配 在 栈 中 ， 这 些 变量 只 有 在 函数 被 调用 的 时 候 才 分 配 ， 而 且 
在 调用 结束 后 就 被 释放 了 。 但 这 个 说 法 主要 针对 基本 数据 类 型 ， 接 下 来 
我 们 介绍 数组 和 对 象 。 





1.7.3 ”数组 和 对 象 的 内 存 分 配 


对 于 数组 和 对 象 类 型 ， 我 们 介绍 过 ， 它 们 都 有 两 块 内 存 ， 一 块 存放 
实际 的 内 容 ， EE 实际 的 内 容 空 s 间 一 般 不 是 分 配 
在 栈 上 的 ， 而 是 分 配 在 扒 《〈 也 是 内 存 的 一 部 分 ， 后 续 章 节 会 进一步 介 
绍 ) 中 ， 但 存放 地 址 的 空间 是 分 配 在 栈 上 的 。 我 们 来 看 个 例子 ; 





public class ArrayMax { 
public static int max(int min, int[] arr) { 
int max = min,; 
for(int a : arr){f 
if(a>max){ 
max = a; 
} 


return max,; 


public static void 0 args) { 
int[] arr = new int[]{2,3,4}; 
int ret = max(0, arr); 
System.out.printilin(ret); 
} 
} 





这 个 程序 也 很 简单 ，main 函 数 新 建 了 一 个 数组 ， 然 后 调用 函数 max 
计算 0 和 数组 中 元 素 的 最 大 值 ， 在 程序 执行 到 max 函 数 的 return 语 句 之 前 
的 时 候 ， 内 存 中 栈 和 扒 的 情况 如 图 1-3 所 示 。 


类 返回 值 存储 此 











术 


图 1-3 ”参数 有 数组 的 内 存 栈 和 堆 示 意图 


对 于 数组 arr， 在 栈 中 存放 的 是 实际 内 容 的 地 址 0x1000， 存 放 地 址 的 
0 
Do] 。 


但 说 堆 空 间 完全 不 受 影响 是 不 正确 的 ， 在 这 个 例子 中 ， 当 main 函 数 
执行 结束 ， 栈 空间 没有 变量 指向 它 的 时 候 ，Java 系 统 会 自动 进行 垃圾 回 
收 ， 从 而 释放 这 块 空间 。 


堆 
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1.7.4 递归 调用 的 原理 


我 们 再 通过 栈 的 角度 来 理解 一 下 递归 函数 的 调用 过 程 ， 代 码 如 下 : 





public static int factorial(int n){ 
If(n==0){ 
return 工 ; 
}elsef{ 
return n*factorial(n-1); 
} 


public static void main(String[] args) { 
int ret = factorial(4); 
System.out.printlin(ret); 

} 





在 factorial 第 一 次 被 调用 的 时 候 ，n 是 4， 在 执行 到 n*factorial (Cn- 
1) ， 即 4*factorial (3) 之 前 的 时 候 ， 栈 的 情况 大 概 如 网 1-4 所 示 。 


注意 ， 返 回 值 存储 占 是 没有 值 的 ， 在 调用 factorial (3) 后 ， 栈 的 情 
况 如 图 1-5 所 示 。 


栈 的 深度 增加 了 ， 返 回 值 存 储 器 依然 为 空 ， 就 这 样 ， 每 递归 调用 一 
次 ， 栈 的 深度 束 增 加 一 层 ， 每 次 调用 都 会 分 配对 应 的 参数 和 局 部 变量 ， 
ee 返回 地 址 ， 在 调用 到 n 等 于 0 的 时 候 ， 栈 的 情况 如 图 1- 
6 所 不 


这 个 时 候 ， 终 于 有 返回 值 了 ， 我 们 将 factorial 人 简写 为 f。f (0) 的 返 


回 值 为 1; f (0) 返回 到 f (1) ，f (1) 执行 1*f (0) ， 结 果 也 是 1;， 然 
后 返回 到 f (2) ，f (2) 执行 2*f (1)〉， 结 果 是 2， 接 着 返回 到 f (3) ， 
f (3) 执行 3*f (2) ， 结 果 是 6， 然 后 返回 到 f (4) ， 执 行 4*f (3) ， 结 
果 是 24。 
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图 1-4 递归 调用 栈 示意 图 ，n 为 4 
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图 1-5 ”递归 调用 栈 示 意图 ，n 为 3 
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图 1-6 递归 调用 栈 示意 图 ，n 为 0 
以 上 就 是 递归 函数 的 执行 过 程 ， 函 数 代码 虽然 只 有 一 份 ， 但 在 执行 


的 过 程 中 ， 每 调用 一 次 ， 就 会 有 一 次 入 栈 ， 生 成 一 份 不 同 的 参数 、 局 部 
变量 和 返回 地 址 。 


factorial(0) “返回 值 存 储 央 
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本 节 介 绍 了 函数 调用 的 基本 原理 ， 函 数 调用 主要 是 通过 栈 来 存储 相 
天 的 数据 ， 系 统 就 函数 调用 者 和 函数 如 何 使 用 栈 做 了 约定 ， 返 回 值 可 以 
简单 认为 是 通过 一 个 专门 的 返回 值 存储 霹 存 储 的 。 


从 函数 调用 的 过 程 可 以 看 出 ， 调 用 是 有 成 本 的 ， 每 一 次 调用 都 需要 
分 配额 外 的 栈 空间 用 于 存储 参数 、 局 部 变量 以 及 返回 地 址 ， 需 要 进行 额 
外 的 入 栈 和 出 栈 操 作 。 在 递归 调用 的 情况 下 ， 如 果 递 归 的 次 数 比 较 多 ， 
这 个 成 本 是 比较 可 观 的 ， 所 以 ， 如 果 程 序 可 以 比较 容易 地 改 为 其 他 方 
式 ， 应 该 考虑 其 他 方式 。 另 外 ， 栈 的 空间 不 是 无 限 的 ， 一 般 正 第 调用 都 
是 没有 问题 的 ， 但 如 果 栈 空间 过 深 ， 系 统 就 会 抛 出 错误 
java.lang.StackOverflowError， 即 栈 淤 出 。 


人 至此， 关于 编程 的 基础 知识 ， 包 括 数据 类 型 和 变量 、 赋 值 、 基 本 运 
算 、 流 程控 制 中 的 条 件 执 行 和 循环 ， 以 及 函 数 的 概念 和 基本 原理 ， 就 介 
绍 完 了。 我 们 谈 到 ， 在 Java 中 ， 函 数 必 须 放 在 类 中 ， 目 前 我 们 简单 认为 
类 只 是 函数 的 容器 ， 但 类 在 Java 中 远 不 止 有 这 个 功能 ， 它 还 承载 了 很 多 














概念 和 思维 方式 ， 在 探讨 类 的 概念 之 前 ， 在 下 一 章 ， 我 们 先 来 进一步 理 
解 下 各 种 基本 数据 类 型 和 文本 背后 的 二 进 制 表示 。 





往生 


第 2 草 “” 理 解数 据 背 后 的 二 进 制 

在 第 1 草 ， 我 们 遗留 了 几 个 问题 。 

' 正 整数 相 乘 的 结果 居然 出 现 了 负数 。 

:非常 基本 的 小 数 运算 结果 居然 不 精确 。 

:字符 类 型 也 可 以 进行 算术 运算 和 比较 。 

要 理解 这 些 行为 ， 我 们 需要 理解 数值 和 文本 字符 在 计算 机 内 部 的 二 
进 制 表示 ， 本 章 就 来 介绍 各 种 数据 背后 的 二 进 制 ， 具 体 分 为 4 节 : 2.1 节 


介绍 整数 ;2.2 节 介绍 小 数 ; 2.3 节 介绍 与 语言 无 关 的 字符 和 文本 的 编码 
以 及 乱码 ; 2.4 节 介绍 Java 中 表示 字符 的 基本 类 型 char。 











2.1 整数 的 二 进 制 表示 与 位 运算 


要 理解 整数 的 二 进 制 ， 我 们 先 来 看 下 熟悉 的 十 进 制 。 我 们 对 十 进 制 
征 如 此 熟悉 ， 可 能 已 忽略 了 它 的 含义 。 比 如 123， 不 假 思 索 我 们 就 知道 
它 的 值 是 多 少 。 


但 其 实 123 表 示 1x (10^2) +2x (10A1) +3x (10A0) (10^2 表 示 10 
的 二 次 方 )， 它 表示 的 是 各 个 位 置 数 字 售 义 之 和 ， 每 个 位 置 的 数字 舍 
与 位 置 有 关 ， 从 右 同 左 ， 第 一 位 乘 以 10 的 0 次 方 ， 即 1， 第 二 位 乘 以 10 的 
1 次 方 ， 即 10， 第 三 位 乘 以 10 的 2 次 方 ， 即 100， 以 此 类 推 。 


换 名 话说， 每 个 位 置 都 有 一 个 位 权 ， 从 右 到 左 ， 第 一 位 为 1， 然 后 
依次 乘 以 10， 即 第 二 位 为 10， 第 三 位 为 100， 以 此 类 推 。 


2.1.1 正 整数 的 二 进 制 表示 


正 整 数 的 二 进 制 表示 与 此 类 似 ， 只 是 在 十 进 制 中 ， 每 个 位 置 可 以 有 
10 个 数字 ， 为 0 一 9， 但 在 二 进 制 中 ， 每 个 位 置 只 能 是 0 或 1。 位 权 的 概念 
是 类 似 的 ， 从 右 到 左 ， 第 一 位 为 1， 然 后 依次 乘 以 2， 即 第 二 位 为 2， 第 
三 位 为 4， 以 此 类 推 。 表 2-1 列 出 了 一 些 数 字 的 二 进 制 与 对 应 的 十 进 制 。 


表 2-1 ”二进制 与 对 应 的 十 进 制 





2.1.2 ” 负 整 数 的 二 进 制 表示 





十 进 制 的 负数 表示 就 是 在 前 面 加 一 个 负数 符号 -， 例 如 -123。 但 二 进 
制 如 何 表示 负数 呢 ? 其 实 概念 是 类 似 的 ， 二 进 制 使 用 最 高 位 表示 符号 
位 ， 用 1 表示 负数 ， 用 0 表示 正 数 。 但 哪个 是 最 高 位 呢 ? 整数 有 4 种 类 型 
byte、short、int、long， 分 别 占 1、2、4、8 个 字 节 ， 即 分 别 占 8、16、 
32、64 位 ， 每 种 类 型 的 符号 位 都 是 其 最 左边 的 一 位 。 为 方便 举例 ， 下 面 











假定 类 型 是 byte， 即 从 右 到 左 的 第 8 位 表示 符号 位 。 


但 负数 表示 不 是 简单 地 将 最 高 位 变 为 1， 比 如 : 








1) byte a=-1， 如 果 只 是 将 最 高 位 变 为 1， 二 进 制 应 该 是 10000001， 
但 实际 上 ， 它 应 该 是 11111111。 








2) byte a=-127， 如 有 果 只 是 将 最 高 位 变 为 1， 二 进 制 应 该 是 
11111111， 但 实际 上 ， 它 却 应 该 是 10000001。 


和 我 们 的 直 党 正好 相反 ， 这 是 什么 表示 法 ? 这 种 表示 法 称 为 补 码 表 
示 法 ， 而 符合 我 们 直觉 的 表示 称 为 原 码 表示 法 ， 补 码 表示 就 是 在 原 码 
表示 的 基础 上 取 反 然后 加 1。 取 反 就 是 将 0 变 为 1，1 变 为 0。 人 负数 的 二 进 
制 表示 就 是 对 应 的 正 数 的 补 码 表示 ， 比 如 : 


1) -1: 1 的 原 码 表示 是 00000001， 取 反 是 11111110， 然 后 再 加 1， 
就 是 11111111 。 

















2) -2: 2 的 原 码 表示 是 00000010， 取 反 是 11111101， 然 后 再 加 1， 
就 是 11111110。 


3) -127: 127 的 原 码 表示 是 01111111， 取 反 是 10000000， 然 后 再 加 
1， 就 是 10000001。 


给 定 一 个 负数 的 二 进 制 表示 ， 要 想 知 道 它 的 十 进 制 值 ， 可 以 采用 相 
同 的 补 码 运算 。 比 如 : 10010010， 首 先 取 反 ， 变 为 01101101， 然 后 加 
1， 结 果 为 01101110， 它 的 十 进 制 值 为 110， 所 以 原 值 就 是 -110。 直 和 觉 
上 ， 应 该 是 先 减 1， 然 后 再 取 反 ， 但 计算 机 只 能 做 加 法 ， 而 补 码 的 一 个 
良好 特性 就 是 ， 对 负数 的 补 码 表示 做 补 码 运算 就 可 以 得 到 其 对 应 正 数 的 
原 码 ， 正 如 十 进 制 运 算 中 负 负 得 正 一 样 。 

对 于 byte 类 型 ， 正 数 最 大 表示 是 01111111， 即 127， 负 数 最 小 表示 
(绝对 值 最 大 ) 是 10000000， 即 -128， 表 示范 围 就 是 -128 一 127。 其 他 类 
型 的 整数 也 类 似 ， 负 数 能 多 表示 一 个 数 。 


负 整 数 为 什么 要 采用 这 种 奇怪 的 表示 形式 呢 ? 原因 是 ， 只 有 这 种 形 
式 ， 计 算 机 才能 实现 正确 的 加 减法 。 


计算 机 其 实 只 能 做 加 法 ，1-1 其 实 是 1+〈-1) 。 如 果 用 原 码 表示 ， 














计算 结果 是 不 对 的 ， 比 如 ; 





1 -> 00000001 
-1 -> 10000001 


-2 -> 10000010 








用 符合 直觉 的 原 码 表 示 ，1-1 的 结果 是 -2， 如 果 是 补 码 表示 : 





1 -> 00000001 
-1 -> 11111111 


© -> 00000000 





结果 是 正确 的 。 再 如 ，5-3: 





5 -> 00000101 
-3 -> 11111101 


2 -> 00000010 





结果 也 是 正确 的 。 就 是 这 样 ， 看 上 去 可 能 比较 奇怪 和 难以 理解 ， 但 
这 种 表示 其 实 是 非常 严 齐 和 正确 的 ， 是 不 是 很 奇妙 ? 


理解 了 二 进 制 加 减法 ， 我 们 就 能 理解 为 什么 正 数 的 运算 结 采 可 能 
现 负 数 了 。 当 计算 结果 超出 表示 范围 的 时 候 ， 最 高 位 往往 是 1， 然 后 就 
会 被 看 作 负 数 。 比 如 ，127+1: 








127 -> 01111111 
1 -> 00000001 


-128 -> 10000000 





计算 结果 超出 了 byte 的 表示 范围 ， 会 被 看 作 -128。 


2.1.3 十 六 进 制 





二 进 制 写 起 来 太 长 ， 为 了 简化 写法 ， 可 以 将 4 个 二 进 制 位 简化 为 一 


个 0 一 15 的 数 ，10 一 15 用 字符 A~E 表 示 ， 这 种 表示 方法 称 为 十 六 进 制 ， 
如 表 2-2 所 示 。 


表 2-2 十 六 进 制 














可 以 用 十 六 进 制 直接 写 和 常量 数字 ， 在 数字 前 面 加 0x 即 可 。 比 如 十 进 
制 的 123， 用 十 六 进 制 表示 是 0x7B， 即 123=7x16+11。 给 整数 赋值 或 者 
进行 运算 的 时 候 ， 都 可 以 直接 使 用 十 六 进 制 ， 比 如 : 





int a = Ox7B,; 








Java 7 之 前 不 支持 直接 写 二 进 制 常量 。 比 如 ， 想 写 二 进 制 形式 的 
11001，Java 7 之 前 不 能 直接 写 ， 可 以 在 前 面 补 0， 补 足 8 位 ， 为 
00011001， 然 后 用 十 六 进 制 表 示 ， 即 0x19。Java 7 开始 支持 二 进 制 常 
量 ， 在 前 面 加 0b 或 0B 即 可 ， 比 如 : 








int a = 0b11001， 





在 Java 中 ， 可 以 方便 地 使 用 Integer 和 Long 的 方法 查看 整数 的 二 进 制 
和 十 六 进 制 表示 ， 例 如 : 














System.out .println(Integer,.toBinaryString(a) ); // 二 进 制 
System.out.println(Integer.toHexString(a)); // 十 六 进 制 
System.out.printLn(Long.toBinaryString(a) ); // 二 进 制 
System.out.println(Long.toHexString(a)); // 十 六 进 币 


























Xe 





2.1.4 位 运算 


理解 了 二 进 制 表示 ， 我 们 来 看 二 进 制 级 别 的 操作 : 位 运算 。Java 7 
之 前 不 能 单独 表示 一 个 位 ， 但 可 以 用 byte 表 示 8 位 ， 用 十 六 进 制 写 二 进 


制 常 量 。 比 如 ，0010 表 示 成 十 六 进 制 是 0x2，110110 表 示 成 十 六 进 制 是 
0x36。 


位 运算 有 移 位 运算 和 逻辑 运算 。 移 位 有 以 下 几 种 。 


1) 左 移 : 操作 符 为 <<， 问 左 移动 ， 右 边 的 低位 补 0， 高 位 的 就 售 大 
挤 了 ， 将 二 进 制 看 作 整 数 ， 左 移 1 位 束 相 当 于 乘 以 2。 


2) 无 符号 右 移 : 操作 符 为 >>>， 癌 右 移 动 ， 右 边 的 舍弃 掉 ， 左 边 补 

3) 有 符号 右 移 : 操作 符 为 >>， 向 右 移动 ， 右 边 的 舍弃 掉 ， 左 边 补 
什么 取决 于 原来 最 高 位 是 什么 ， 原 来 是 1 就 补 1， 原 来 是 0 就 补 0， 将 二 进 
制 看 作 整 数 ， 右 移 1 位 相当 于 除 以 2。 

例如 : 











int a = 4; //100 
a = a >> 2; //001， 等 于 1 
a = a << 3 //1000， 变 为 8 








逻辑 运算 有 以 下 几 种 。 

按 位 与 &: 两 位 都 为 1 才 为 1。 

按 位 或 |; 只 要 有 一 位 为 1， 残 为 1。 

- 按 位 取 反 ~: 1 变 为 0，0 变 为 1。 

" 按 位 寞 或 ^， 相 寞 为 真 ， 相 同 为 假 。 

大 部 分 都 比较 简单 ， 如 下 所 示 ， 上 其 体 就 不 次 述 了。 

















ar 
a & 0x1 // 返 回 0 或 1， 就 是 a 最 右边 一 位 的 值 
= a | 9x1 // 不 管 a 原 来 最 右边 一 位 是 什么 ， 都 将 设 为 1 











2.2 ”小数 的 二 进 制 表示 


计算 机 之 所 以 叫 “ 计 算 ” 机 ， 就 是 因为 友 明 它 主 要 是 用 来 计算 
的 , “计算 ”当然 是 它 的 特长 ， 在 大 家 的 印象 中 ， 计 算 一 定 是 非常 准确 
ee 即使 在 一 些 非常 基本 的 小 数 运 算 中 ， 计 算 的 结果 也 是 不 
精 丰 J， 上 0D: 




















float f = 0.1f*0.1f; 
System.out.println(f); 





这 个 结果 看 上 去 ， 应 该 是 0.01， 但 实际 上 ， 屏 幕 输出 却 是 
0.010000001， 后 面 多 了 个 1。 看 上 去 这 么 简单 的 运算 ， 计 算 机 怎么 会 出 
昔 了 呢 ? 


2.2.1 ”小数 计算 为 什么 会 出 错 














实际 上 ， 不 是 运算 本 身 会 出 错 ， 而 是 计算 机 根本 就 不 能 精确 地 表示 
很 多 数 ， 比 如 0.1 这 个 数 。 计 算 机 是 用 一 种 二 进 制 格式 存储 小 数 的 ， 这 
个 二 进 制 格式 不 能 精确 表示 0.1， 它 只 能 表示 一 个 非常 接近 0.1 但 又 不 等 
于 0.1 的 一 个 数 。 数 字 都 不 能 精确 表示 ， 在 不 精确 数字 上 的 运算 结果 不 
精确 也 就 不 足 为 奇 了 。 


0.1 怎 么 就 不 能 精确 表示 呢 ? 在 十 进 制 的 世界 里 是 可 以 的 ， 但 在 二 
进 制 的 世界 里 不 行 。 在 说 二 进 制 之 前 ， 我 们 先 来 看 下 熟悉 的 十 进 制 。 


实际 上 ， 十 进 制 也 只 能 表示 那些 可 以 表述 为 10 的 多 少 次 方 和 的 数 ， 
比如 12.345， 实 际 上 表示 的 是 1x10+2x1+3x0.1+4x0.01+5x0.001， 与 整数 
的 表示 类 似 ， 小 数 点 后 面 的 每 个 位 置 也 都 有 一 个 位 权 ， 从 左 到 右 ， 依 次 
为 0.1，0.01，0.001... 即 10^ (-1) ，10A (-2) ，10^(-3) 等 。 


很 多 数 十 进 制 也 是 不 能 精确 表示 的 ， 比 如 1/3， 保 留 三 位 小 数 的 
话 ， 十 进 制 表示 是 0.333， 但 无 论 后 面 保留 多 少 位 小 数 ， 都 是 不 精确 
的 ， 用 0.333 进 行 运算 ， 比 如 乘 以 3， 期 望 结 果 是 1， 但 实际 上 却 是 
0.999 。 


二 进 制 是 类 似 的 ， 但 二 进 制 只 能 表示 那些 可 以 表述 为 2 的 多 少 次 方 
和 的 数 。 来 看 下 2 的 次 方 的 一 些 例子 ， 如 表 2-3 所 示 。 


表 2-3 2 的 次 方 


二 进 制 十 进 制 
2^(-1) 0.5 
2^(-2) 0.25 
2^(-3) 0.125 
2^(-4) 0.0625 





可 以 精确 表示 为 2 的 条 次 方 之 和 的 数 可 以 精确 表示 ， 其 他 数 则 不 能 
精确 表示 。 


为 什么 计算 机 中 不 能 用 我 们 熟悉 的 十 进 制 呢 ? 在 最 底层 ， 计 算 机 使 
用 的 电子 元 右 件 只 能 表示 两 个 状态 ， 通 党 是 低压 和 高 压 ， 对 应 0 和 1， 使 
用 二 进 制 容易 基于 这 些 电子 元 器件 构建 硬件 设备 和 进行 运算 。 如 果 非 要 
使 用 十 进 制 ， 则 这 些 硬件 就 会 复杂 很 多 ， 并 且 效 率 低下 。 


如 采编 写 程序 进行 试验 ， 会 发 现 有 的 计算 结果 是 准确 的 。 比 如 ， 用 


Java 写 








System,out.println(0.1f+0.1f)， 
System,out.println(0.1f*0.1f)， 


第 一 行 输出 0.2， 第 二 行 输出 0.010000001。 按 照 上 面 的 说 法 ， 第 一 
行 的 结果 应 该 也 不 对 。 其 实 ， 这 只 是 Java 语 言 给 我 们 造成 的 假象 ， 计 算 
结果 其 实 也 是 不 精确 的 ， 但 是 由 于 结果 和 0.2 足 够 接近 ， 在 输出 的 时 
候 ，Java 选 择 了 输出 0.2 这 个 看 上 去 非常 精简 的 数字 ， 而 不 是 一 个 中 间 有 
很 多 0 的 小 数 。 在 误差 足够 小 的 时 候 ， 结 果 看 上 去 是 精确 的 ， 但 不 精确 
其 实 可 是 第 态 。 





计算 不 精确 ， 怎 么 办 呢 ? 大 部 分 情况 下 ， 我 们 不 需要 那么 高 的 精 
度 ， 可 以 四 舍 五 入 ， 或 者 在 输出 的 时 候 只 保留 固定 个 数 的 小 数位 。 如 果 
真 的 需要 比较 高 的 精度 ， 一 种 方法 是 将 小 数 转化 为 整数 进行 运算 ， 运 算 
结束 后 再 转化 为 小 数 ， 另 一 种 方法 是 使 用 十 进 制 的 数据 类 型 ， 这 个 并 没 
有 统一 的 规范 。 在 Java 中 是 BigDecimal， 运 算 更 准确 ， 但 效率 比较 低 ， 
本 节 就 不 介绍 了 。 


2.2.2 二进制 表示 


我 们 之 前 一 直 在 用 “小 数 ” 这 个 词 表 示 float 和 double 类 型 ， 其 实 ， 这 
是 不 严谨 的 ， “小 数 ” 是 在 数学 中 用 的 词 ， 在 计算 机 中 ， 我 们 一 般 说 的 
是 “ 浮 点 数 "”。float 和 double 被 称 为 浮 点 数据 类 型 ， 小 数 运算 被 称 为 浮 点 
算 。 


为 什么 要 叫 浮 点 数 呢 ? 这 是 由 于 小 数 的 二 进 制 表示 中 ， 表 示 那 个 小 
数 点 的 时 候 ， 扣 不 是 固定 的 ， 而 是 浮动 的 。 


我 们 还 是 用 十 进 制 类 比 ， 十 进 制 有 科学 记 数 法 ， 比 如 123.45 这 个 
数 ， 直 接 这 么 写 ， 就 是 固定 表示 法 ， 如 果 用 科学 记 数 法 ， 在 小 数 点 前 只 
保留 一 位 数字 ， 可 以 写 为 1.2345E2 即 1.2345x (10A2) ， 即 在 科学 记 数 法 
中 ， 小 数 点 向 左 浮动 了 两 位 。 


二 进 制 中 为 表示 小 数 ， 也 采用 类 似 的 科学 表示 法 ， 形 如 
mx (2Ae) 。m 称 为 尾数 ，e 称 为 指数 。 指 数 可 以 为 正 ， 也 可 以 为 负 ， 负 
的 指数 表示 那些 接近 0 的 比较 小 的 数 。 在 二 进 制 中 ， 单 独 表示 尾数 部 分 
和 指数 部 分 ， 男 外 还 有 一 个 符号 位 表示 正 负 。 


几乎 所 有 的 硬件 和 编程 语言 表示 小 数 的 二 进 制 格式 都 是 一 样 的 。 这 
种 格式 是 一 个 标准 ， 叫 做 IEEE 754 标 准 ， 它 定义 了 两 种 格式 : 一 种 是 32 
位 的 ， 对 应 于 Java 的 float; 男 一 种 是 64 位 的 ， 对 应 于 Java 的 double。 


32 位 格式 中 ，1 位 表示 符号 ，23 位 表示 尾数 ，8 位 表示 指数 。64 位 格 
式 中 ，1 位 表示 符号 ，52 位 表示 尾数 ，11 位 表示 指数 。 在 两 种 格式 中 ， 
除了 表示 正常 的 数 ， 标 准 还 规定 了 一 些 特殊 的 二 进 制 形式 表示 一 些 特殊 
的 值 ， 比 如 负 无 穷 、 正 无 穷 、0、NaN 〈 非 数值 ， 比 如 0 乘 以 无 穷 大 ) 。 
IEEE 754 标 准 有 一 些 复杂 的 细节 ， 初 次 看 上 去 难以 理解 ， 对 于 日 常 应 用 
也 不 常用 ， 本 书 就 不 介绍 了 。 


» 


| 


问 




















如 果 想 查看 译 点 数 的 具体 二 进 制 形式 ， 在 Java 中 ， 可 以 使 用 如 下 代 
人 码 : 





Integer.toBinaryString(Float.floatToIntBits(value)) 
Long.toBinaryString(Double.doubleToLongBits(value)); 





2.3 字符 的 编码 与 乱码 


本 节 讨 论 与 语言 无 关 的 字符 和 文本 的 编码 以 及 乱码 。 我 们 在 处 理 文 
件 、 浏 览 网 页 、 编 号 程序 时 ， 时 不 时 会 磁 到 乱码 的 情况 。 乱 码 几 乎 总 是 
令 人 心烦 ， 让 人 困惑 ， 通 过 阅读 本 节 ， 相 信 你 就 可 以 目 信和 从 容 地 面 对 乱 
码 ， 进 而 恢复 乱码 了 。 


编码 和 乱码 听 起 来 比较 复杂 ， 但 其 实 并 不 复杂 ， 请 耐心 阅读 ， 让 我 
们 逐步 来 探讨 。 我 们 先 介绍 各 种 编码 ， 然 后 介绍 编码 转换 ， 分 析 乱 码 出 
现 的 原因 ， 最 后 介绍 如 何 从 乱码 中 恢复 。 编 码 有 两 大 类 : 一 类 是 非 
Unicode 编 码 ; 另 一 类 是 Unicode 编 码 。 我 们 先 介绍 非 Unicode 编 码 。 
































2.3.1 各 见 非 Unicode 编 码 


下 面 我 们 看 一 些 主要 的 非 Unicode 编 码 ， 包 括 ASCII、1ISO 8859-1、 
Windows-1252、GB2312、GBK、GB18030 和 Big5。 


1.ASCII 


世界 上 虽然 有 各 种 各 样 的 字符 ， 但 计算 机 发 明之 初 没 有 考虑 那么 
多 ， 基 本 上 只 考虑 了 美国 的 需求 。 美 国 大 概 只 需要 128 个 字符 ， 所 以 就 
规定 了 128 个 字符 的 二 进 制 表示 方法 。 这 个 方法 是 一 个 标准 ， 称 为 ASCII 
编码 ， 全 称 是 American Standard Code for Information Interchange， 即 美 
国信 息 互 换 标准 代码 。 


128 个 字符 用 7 位 刚好 可 以 表示 ， 计 算 机 存储 的 最 小 单位 是 byte， 即 
8 位 ，ASCII 码 中 最 高 位 设置 为 0， 用 剩 下 的 7 位 表示 字符 。 这 7 位 可 以 看 
作 数 字 0 一 127，ASCII 码 规定 了 从 0 一 127 的 每 个 数字 代表 什么 含义 。 


我 们 先 来 看 数字 32 一 126 的 含义 ， 如 图 2-1 所 示 ， 除 了 中 文 之 外 ， 我 
们 平常 用 的 字符 基本 都 涵盖 了 ， 键 盘 上 的 字符 大 部 分 也 都 涵盖 了 。 
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图 2-1 ASCII 编 码 : 可 打印 字符 
数字 32 一 126 表 示 的 字符 都 是 可 打印 字符 ，0 一 31 和 127 表 示 一 些 不 
可 以 打印 的 字符 ， 这 些 字 符 一 般 用 于 控制 目的 ， 这 些 字符 中 大 部 分 都 是 
不 常用 的 ， 表 2-4 列 出 了 其 中 相对 常用 的 字符 。 
表 2-4 ASCII 编 码 : 常用 不 可 打印 字符 











10 LF (NL line feed., new line) \n 
13 CR (carriage return ) 回 车 键 \r 


127 DEL (delete) 删除 


ASCII 码 对 美国 是 够 用 了 ， 但 对 其 他 国家 而 言 却 是 不 够 的 ， 于 是 ， 
各 个 国家 的 各 种 计算 机 厂商 就 发 明了 各 种 各 种 的 编码 方式 以 表示 自己 国 
家 的 字符 ， 为 了 保持 与 ASCII 码 的 兼容 性 ， 一 般 都 是 将 最 高 位 设置 为 1。 
也 就 是 说 ， 当 最 高 位 为 0 时， 表示 ASCII 码 ， 当 为 1 时 就 是 各 个 国家 自己 
的 字符 。 在 这 些 扩展 的 编码 中 ， 在 西欧 国家 中 流行 的 是 ISO 8859-1 和 
Windows-1252， 在 中 国 是 GB2312、GBK、GB18030 和 Big5， 我 们 逐个 
介绍 这 些 编码 。 














2.1SO 8859-1 





ISO 8859-1 又 称 Latin-1， 它 也 是 使 用 一 个 字 节 表示 一 个 字符 ， 其 中 0 
127 与 ASCII 一 样 ，128 一 255 规 定 了 不 同 的 含义 。 在 128 一 255 中 ，128 
一 159 表 示 一 些 控制 字符 ， 这 些 字 符 也 不 党 用， 就 不 介绍 了 。160 一 255 
表示 一 些 西欧 字符 ， 如 图 2-2 所 示 。 


NBSP i ¢ £ u 至 ] S 站 © a « I SHY ® 
0020 00a1 00a2 00a3 00a4 00a5 00a6 00A7 00a8 00a9 00RR 00aB | 00ac 00ap 00AE OOAF 
160 161 162 163 164 165 166 167 168 169 170 171 | 172 173 174 175 
+ 2 3 站 可 1 ke] | 杂 蕊 为 2 
00B0 00B1 00B2 00B3 00B4 00B5 00B6 00B7 00B8 00B9 00BA 00BB 00Bc 00BD 00BE 0BF 
176 177 178 179 180 181 182 183 | 184 185 186 187 | 188 189 190 191 
A A A A A A 下 E 导 EE 号 2 I 工 
00cC0 00c1 00C2 00Cc3 00C4 00c5 00C6 00c7 00c8 00c9 00CR 00CB oocc 00cD 00CE 00CF 
192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 
D N [e] 0 0 0 0 x 乡 U U td Ui 立 pb B 
00D0 00D1 00D2 00D3 00D4 00D5 00D6 00D7 00D8 00D9 00DA 00DB 00DcC 00DD 00DBE 00DF 
208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 
E1 喜 全 El 总 a 3 G e é 所 所 I LL Y 
oog0 00E1 00E2 00E3 00E4 00E5 00E6 00E7 00E8 00E9 00ER 00EB 00EC 00ED 00EE 00EP 
224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 
6 五 [el 6 6 6 6 + [2 u 芯 a i bd b Bd 
00F0 00F1 00F2 00F3 00F4 00P5 00F6 00F7 00F8 00F9 00FA 00FB ooFc 00FD 00FE 00FF 
240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 


图 2-2 ISO 8859-1 
3.Windows-1252 


ISO 8859-1 虽 然 号 称 是 标准 ， 用 于 西欧 国家 ， 但 它 连 欧元 〈@) 这 个 
符号 都 没有 ， 因 为 欧元 比较 晚 ， 而 标准 比较 早 。 实 际 中 使 用 更 为 广泛 的 
是 Windows-1252 编码 ， 这 个 编码 与 ISO 8859-1 基 本 是 一 样 的 ， 区 别 只 在 
于 数字 128 一 159。Windows-1252 使 用 其 中 的 一 些 数 字 表 示 可 打印 字符 ， 
这 些 数 字 表 示 的 含义 如 图 2-3 所 示 。 








图 2-3 ”Windows-1252 编 码 : 区 别 于 ISO8859-1 的 部 分 


这 个 编码 中 加 入 了 欧元 符号 以 及 一 些 其 他 常用 的 字符 。 基 本 上 可 以 
认为 ，ISO 8859-1 已 被 Windows-1252 取 代 ， 在 很 多 应 用 程序 中 ， 即 使 文 
件 声明 它 采 用 的 是 ISO 8859-1 编 码 ， 解 析 的 时 候 依然 被 当 作 Windows- 
1252 编 码 。 


HTML5 甚 至 明确 规定 ， 如 果 文 件 声 明 的 是 ISO 8859-1 编 码 ， 它 应 该 
被 看 作 Win-dows-1252 编 码 。 为 什么 要 这 样 呢 ? 因为 大 部 分 人 搞 不 清楚 
ISO 8859-1 和 Windows-1252 的 区 别 ， 当 他 说 ISO 8859-1 的 时 候 ， 其 实 他 
指 的 是 Windows-1252， 所 以 标准 干脆 束 这 么 强制 规定 了 。 


4.GB2312 

美国 和 西欧 字符 用 一 个 字 节 就 够 了 ， 但 中 文 显然 是 不 够 的 。 中 文 第 
一 个 标准 是 GB2312。GB2312 标 准 主 要 针对 的 是 简体 中 文 常见 字符 ， 包 
括 约 7000 个 汉字 和 一 些 罕 用 词 和 繁体 字 。 

GB2312 固 定 使 用 两 个 字 节 表示 汉字 ， 在 这 两 个 字 节 中 ， 最 品位 都 
是 1， 如 果 是 0， 束 认为 是 ASCII 字 符 。 在 这 两 个 字 节 中 ， 其 中 高 位 字 节 
范围 是 0xA1~0xF7， 低 位 字 节 范围 是 0xA1~0xFE。 

比如 ,，“ 老 马 ” 的 GB2312 编 码 〈 十 六 进 制 表示 ) 如 表 2-5 所 示 。 


表 2-5 ”GB2312 编 码 示例 











和 





5.GBK 


GBK 建 立 在 GB2312 的 基础 上 ， 向 下 兼容 GB2312， 也 就 是 说 ， 
GB2312 编 码 的 字符 和 二 进 制 表示 ， 在 GBK 编 码 里 是 完全 一 样 的 。GBK 
增加 了 14000 多 个 汉字 ， 共 计 约 21000 个 汉字 ， 其 中 包括 繁体 字 。 


GBK 同 样 使 用 固定 的 两 个 字 节 表示 ， 其 中 高 位 字 节 范围 是 0x81 一 
0xFE， 低 位 字 节 范围 是 0x40 一 0x7E 和 0x80 一 0xFE。 


需要 注意 的 是 ， 低 位 字 节 是 从 0x40《〈 也 就 是 64) 开始 的 ， 也 就 是 
次， 低位 字 节 的 最 高 位 可 能 为 0。 那 怎么 知道 它 是 汉字 的 一 部 分 ， 还 是 
一 个 ASCI 字 符 呢 ? 其 实 很 简单 ， 因 为 汉字 是 用 固定 两 个 字 节 表示 的 ， 
在 解析 二 进 制 流 的 时 候 ， 如 果 第 一 个 字 节 的 最 蜗 位 为 1， 那 么 就 将 下 一 
个 字 市 读 进 来 一 起 解析 为 一 个 汉字 ， 而 不 用 考虑 它 的 最 品位 ， 解 析 完 











后 ， 跳 到 第 三 个 字 市 继续 解析 。 


6.GB18030 





GB18030 向 下 兼容 GBK， 增 加 了 55000 多 个 字符 ， 共 76000 多 个 字 
符 ， 包 括 了 很 多 少数 民族 字符 ， 以 及 中 日 韩 统一 字符 。 


用 两 个 字 节 已 经 表示 不 了 GB18030 中 的 所 有 字符 ，GB18030 使 用 变 
长 编码 ， 有 的 字符 是 两 个 字 节 ， 有 的 是 四 个 字 节 。 在 两 字 节 编码 中 ， 字 
节 表 示范 围 与 GBK 一 样 。 在 四 字 节 编码 中 ， 第 一 个 字 节 的 值 为 0x81 一 
0xFE， 第 二 个 字 节 的 值 为 0x30~~0x39， 第 三 个 字 节 的 值 为 0x81~ 
0xFE， 第 四 个 字 节 的 值 为 0x30 一 0x39。 


解析 二 进 制 时 ， 如 何 知 道 是 两 个 字 节 还 是 4 个 字 节 表示 一 个 字符 
呢 ? 看 第 二 个 字 节 的 范围 ， 如 果 是 0x30 一 0x39 就 是 4 个 字 节 表 示 ， 因 为 
两 个 字 节 编码 中 第 二 个 字 节 都 比 这 个 大 。 


7.Big5 


Big5 是 针对 繁体 中 文 的 ， 广 泛 用 于 我 国 台湾 地 区 和 我 国 香港 特别 行 
政 区 等 地 。Big5 包 括 13000 多 个 繁体 字 ， 和 GB2312 类 似 ， 一 个 字符 同样 
固定 使 用 两 个 字 节 表示 。 在 这 两 个 字 节 中 ， 高 位 字 节 范 围 是 0x81 一 
0xFE， 低 位 字 节 范围 是 0x40~~0x7E 和 0xA1~0xFE。 



































8. 编 码 汇总 

我 们 简单 汇总 一 下 前 面 的 内 容 。 

ASCII 码 是 基础 ， 使 用 一 个 字 节 表示 ， 最 高 位 设 为 0， 其 他 7 位 表示 
128 个 字符 。 其 他 编码 都 是 兼容 ASCII 的 ， 最 高 位 使 用 1 来 进行 区 分 。 
羡 西欧 主要 使 用 Windows-1252， 使 用 一 个 字 节 ， 增 加 了 额外 128 个 字 
符 。 


我 国内 地 的 三 个 主要 编码 GB2312、GBK、GB18030 有 时 间 先 后 关 
系 ， 表 示 的 字符 数 越 来 越 多 ， 且 后 面 的 兼容 前 面 的 ，GB2312 和 GBK 都 
是 用 两 个 字 节 表示 ， 而 GB18030 则 使 用 两 个 或 四 个 字 节 表示 。 


我 国 香港 特别 行政 区 和 我 国人 台湾 地 区 的 主要 编码 是 Big5。 











如 琳 文 本 里 的 字符 都 是 ASCII 码 字符 ， 那 么 采用 以 上 所 说 的 任 一 编 
码 方式 都 是 一 样 的 。 


但 如 果 有 高 位 为 1 的 字符 ， 除 了 GB2312、GBK、GB18030 外 ， 其 他 
编码 都 是 不 兼容 的 。 比 如 ，Windows-1252 和 中 文 的 各 种 编码 是 不 兼容 
的 ， 即 使 Big5 和 GB18030 都 能 表示 繁体 字 ， 其 表示 方式 也 是 不 一 样 的 ， 
而 这 就 会 出 现 所 谓 的 乱码 ， 有 具体 我 们 稍 后 介绍 。 








2.3.2” ”Unicode 编码 


以 上 我 们 介绍 了 中 文 和 西欧 的 字符 与 编码 ， 但 世界 上 还 有 很 多 其 他 
国家 的 字符 ， 每 个 国家 的 各 种 计算 机 广 商都 对 目 己 第 用 的 字符 进行 纺 
码 ， 在 编码 的 时 候 基 本 忽略 了 其 他 国家 的 字符 和 编码 ， 甚 至 忽略 了 同一 
0 这 样 造成 的 结果 就 是 ， 出 现 了 太 多 的 编码 ， 且 
互相 不 兼容 。 


世界 上 所 有 的 字符 能 不 能 统一 编码 呢 ? 可 以 ， 这 就 是 Unicode。 


Unicode 做 了 一 件 事 ， 就 是 给 世界 上 所 有 字符 都 分 配 了 一 个 唯一 的 
数字 编号 ， 这 个 编号 范围 从 0x000000 一 0x10FFFFE， 和 包括 110 多 万 。 但 大 
部 分 常用 字符 都 在 0x0000 一 0xFFFF 之 间 ， 即 65536 个 数字 之 内 。 每 个 字 
符 都 有 一 个 Unicode 编 号 ， 这 个 编号 一 般 写成 十 六 进 制 ， 在 前 面 加 U+。 
大 部 分 中 文 的 编号 范围 为 U+4E00 一 U+9FFF， 例 如 ，“ 马 ”的 Unicode 是 
U+9A6C。 


简单 理解 ，Unicode 主 要 做 了 这 么 一 件 事 ， 就 是 给 所有 字符 分 配 了 
唯一 数字 编号 。 它 并 没有 规定 这 个 编写 怎么 对 应 到 二 进 制 表示 ， 这 是 与 
上 面 介绍 的 其 他 编码 不 同 的 ， 其 他 编码 都 既 规 定 了 能 表示 哪些 字符 ， 又 
规定 了 每 个 字符 对 应 的 二 进 制 是 什么 ， 而 Unicode 本 身 只 规定 了 每 个 字 
符 的 数字 编号 是 多 少 。 


那 编号 怎么 对 应 到 二 进 制 表示 呢 ? 有 多 种 方案 ， 主 要 有 UTEF-32、 
UTF-16 和 UTF-8。 

















1.UTF-32 


这 个 最 简单 ， 就 是 字符 编号 的 整数 二 进 制 形式 ，4 个 字 节 ， 





但 有 个 细节 ， 束 是 字 节 的 排列 顺序 ， 如 果 第 一 个 字 节 是 整数 二 进 制 
中 的 最 高 位 ， 最 后 一 个 字 节 是 整数 二 进 制 中 的 最 低位 ， 那 这 种 字 节 序 就 
叫 “ 大 端 ”〈Big Endian，BE)〉， 耕 则 ， 就 叫 “ 小 端 ”(Little Endian， 
LE) 。 对 应 的 编码 方式 分 别 是 UTF-32BE 和 UTF-32LE。 


可 以 看 出 ， 每 个 字符 都 用 4 个 字 市 表示 ， 非 党 浪费 空间 ， 实 际 采 用 
的 也 比较 少 。 


2.UTF-16 
UTF-16 使 用 变 长 字 节 表示 : 


1) 对 于 编号 在 U+0000 一 U+FFFEF 的 字符 《〈 常 用 字符 集 ) ， 直 接 用 
两 个 字 节 表示 。 需 要 说 明 的 是 ，U+D800~U+DBFEF 的 编号 其 实 是 没有 
定义 的 。 


2) 字符 值 在 U+10000 一 U+10FFFF 的 字符 〈 也 叫做 增补 字符 集 ) ， 
需要 用 4 个 字 节 表示 。 前 两 个 字 节 叫 高 代理 项 ， 范 围 是 U+D800 一 
U+DBFF; 后 两 个 字 节 叫 低 代 理 项 ， 范 围 是 U+DC00 一 U+DFFF。 数 字 编 
号 和 这 个 二 进 制 表示 之 间 有 一 个 转换 算法 ， 本 书 就 不 介绍 了 。 

区 分 是 两 个 字 节 还 是 4 个 字 节 表示 一 个 字符 惑 看 前 两 个 字 节 的 编号 
范围 ， 如 果 是 U+D800~U+DBFF， 就 是 4 个 字 节 ， 和 否则 就 是 两 个 字 节 。 

UTF-16 也 有 和 UTF-32 一 样 的 字 节 序 问题 ， 如 果 高 位 存放 在 前 面 就 


叫 大 端 (BE) ， 编 码 就 叫 UTF-16BE， 否 则 就 叫 小 端 ， 编 码 就 叫 UTF- 
16LE。 


UTF-16 常 用 于 系统 内 部 编码 ，UTF-16 比 UTF-32 节 省 了 很 多 空间 ， 
但 是 任何 一 个 字符 都 至 少 需要 两 个 字 节 表示 ， 对 于 美国 和 西欧 国家 而 
言 ， 还 是 很 浪费 的 。 
3.UTF-8 


UTF-8 使 用 变 长 字 市 表示 ， 每 个 字符 使 用 的 字 贡 个 数 与 其 Unicode 编 
号 的 大 小 有 关 ， 编 号 小 的 使 用 的 字 节 就 少 ， 编 号 大 的 使 用 的 字 节 就 多 ， 
使 用 的 字 节 个 数 为 1 一 4 不 等 。 


具体 来 说 ， 各 个 Unicode 编 写 范 围 对 应 的 二 进 制 格式 如 表 2-6 所 示 。 
































表 2-6” UTF-8 编 码 的 编号 范围 与 对 应 的 二 进 制 格 式 


编号 范 二 进 制 格式 
OxQ0~~0x7B (0==127) OxxXXXXKXX 
0x80 一 0x7FF ( 128 一 2047 ) 110XXXXX 10XXXXXX 
Ox800~0xFFFF (2048~65 535 ) lllOxxxx 10XXXXXX 10XXXXXX 
0x10000 一 0x10FFFF ( 65 536 以 上 ) llllOxxx 10XXXXXX 10XXXXXX 10XXXXXX 


本 表 2-6 中 的 x 表 示 可 以 用 的 二 进 制 位 ， 而 每 个 字 节 开头 的 1 或 0 是 固定 


小 于 128 的 ， 编 码 与 ASCII 码 一 样 ， 最 高 位 为 0。 其 他 编号 的 第 一 个 
字 节 有 特殊 含义 ， 最 高 位 有 几 个 连续 的 1 就 表示 用 几 个 字 节 表示 ， 而 其 
他 字 节 都 以 10 开 头 。 


对 于 一 个 Unicode 编 号 ， 有 具体 怎么 编码 呢 ? 首先 将 其 看 作 整 数 ， 转 
化 为 二 进 制 形式 〈 去 掉 高 位 的 0) ， 然 后 将 二 进 制 位 从 右 向 左 依次 填 入 
I 填 完 后 ， 如 果 对 应 的 二 进 制 格 式 还 有 没 填 的 x， 
则 设 为 0。 


我 们 来 看 个 例子 ，“ 马 ”的 Unicode 编 号 是 0x9A6C， 整 数 编号 是 
39532， 其 对 应 的 UTF-8 二 进 制 格式 是 : 














1110xxxx 10xxxxxx 10xxxxxx 





整数 编号 39532 的 二 进 制 格 式 是 : 





1001 101001 101100 





将 这 个 三 进 制 位 从 右 到 左 依 次 填 入 二 进 制 格式 中 ， 结 果 就 是 其 
UTF-8 编 人 码 : 





11101001 10101001 10101100 





十 六 进 制 表 示 为 0xXE9A9AC。 





和 UTF-32/UTF-16 不 同 ，UTF-8 是 兼容 ASCII 的 ， 对 大 部 分 中 文 而 
言 ， 一 个 中 文字 符 需 要 用 三 个 字 节 表示 。 











4.Unicode 编 码 小 结 


Unicode 给 世界 上 所 有 字符 都 规定 了 一 个 统一 的 编号 ， 编 号 范围 达 
到 110 多 万 ， 但 大 部 分 字符 都 在 65536 以 内 。Unicode 本 身 没 有 规定 怎么 
把 这 个 编号 对 应 到 二 进 制 形式 。 


UTF-32/UTF-16/UTF-8 都 在 做 一 件 事 ， 就 是 把 Unicode 编 号 对 应 到 二 
进 制 形式 ， 其 对 应 方法 不 同 而 已 。UTF-32 使 用 4 个 字 节 ，UTF-16 大 部 分 
是 两 个 字 节 ， 少 部 分 是 4 个 字 节 ， 它 们 都 不 兼容 ASCII 编 码 ， 都 有 字 节 顺 
序 的 问题 。UTF-8 使 用 1 一 4 个 字 节 表示 ， 兼 容 ASCII 编 码 ， 瑞 文字 符 使 
用 1 个 字 节 ， 中 文字 符 大 多 用 3 个 字 节 。 




















2.3.3 ”编码 转换 








有 了 Unicode 之 后 ， 每 一 个 字符 就 有 了 多 种 不 兼容 的 编码 方式 ， 比 
如 说 “ 马 ? 这 个 字符 ， 它 的 各 种 编码 方式 对 应 的 十 六 进 制 如 表 2-7 所 示 。 


表 2-7 字符 “ 马 ” 多 种 编码 方式 








Unicode 编号 9A 6C UTF-16LE 6C 9A 


这 几 种 格式 之 间 可 以 借助 Unicode 编 号 进行 编码 转换 。 可 以 认为 : 
每 种 编码 部 有 一 个 映 冉 表 ， 存 储 其 特有 的 字符 编码 和 Unicode 编 写 之 间 
的 对 应 关系 ， 这 个 映射 表 是 一 个 简化 的 说 法 ， 实 际 上 可 能 是 一 个 映射 或 
转换 方法 。 

编码 转换 的 具体 过 程 可 以 是 : 一 个 字符 从 A 编码 转 到 B 编 码 ， 先 找 


到 字符 的 A 编码 格式 ， 通 过 A 的 映射 表 找 到 其 Unicode 编 写 ， 然 后 通过 
Unicode 编 号 再 碍 B 的 映射 表 ， 找 到 字符 的 B 编 码 格式 。 


举例 来 说 ，“ 马 ”从 GB18030 转 到 UTF-8， 先 查 GB18030->Unicode 编 
号 表 ， 得 到 其 编号 是 9A 6C， 然 后 查 Uncode 编 号 ->UTF-8 表 ， 得 到 其 


UTEF-8 编 码 : E9A9AC。 
编码 转换 改变 了 字符 的 二 进 制 内 容 ， 但 并 没有 改变 字符 看 上 去 的 样 


2.3.4 乱码 的 原因 


理解 了 编码 ， 我 们 来 看 乱码 。 乱 码 有 两 种 常见 原因 : 一 种 比较 简 
单 ， 就 是 简单 的 解析 错误 ， 男 外 一 种 比较 复杂 ， 在 错误 解析 的 基础 上 进 
行 了 编码 转换 。 我 们 分 别 介绍 。 


1. 解 析 错 误 


看 个 简单 的 例子 。 一 个 法 国人 采用 Windows-1252 编 码 写 了 个 文件 ， 
发 送 给 了 一 个 中 国人 ， 中 国人 使 用 GB18030 来 解析 这 个 字符 ， 看 到 的 可 
能 就 是 乱码 。 比 如 ， 法 国人 发 送 的 是 Ptkin，Windows-1252 的 二 进 制 
(采用 十 六 进 制 ) 是 50E96B 696E， 第 二 个 字 节 E9 对 应 6， 其 他 都 是 
ASCII 码 ， 中 国人 收 到 的 也 是 这 个 二 进 制 ， 但 是 他 把 它 看 成 了 GB18030 
编码 ，GB18030 中 E96B 对 应 的 是 字符 “ 闭 ”， 于 是 他 看 到 的 就 是 “了 闭 
in”， 这 看 来 就 是 一 个 乱码 。 


反之 也 是 一 样 的 ， 一 个 GB18030 编 码 的 文件 如 果 被 看 作 Windows- 
1252 也 是 乱码 。 


这 种 情况 下 ， 之 所 以 看 起 来 是 乱码 ， 是 因为 看 待 或 者 说 解析 数据 的 
方式 错 了 。 只 要 使 用 正确 的 编码 方式 进行 解读 就 可 以 纠正 了 。 很 多 文件 
编辑 器 ， 如 EditPlus、NotePad++、UltraEdit 都 有 切换 查看 编码 方式 的 功 
能 ， 浏 览 器 也 都 有 切换 查看 编码 方式 的 功能 ， 如 Fire-fox， 在 菜单 “ 查 
看 ” -文字 编码 ”中 即 可 找到 该 功能 。 


切换 查看 编码 的 方式 并 没有 改变 数据 的 二 进 制 本 号 ， 而 只 是 改变 了 
解析 数据 的 方式 ， 从 而 改变 了 数据 看 起 来 的 样子 ， 这 与 前 面 提 到 的 编码 
转换 正好 相反 。 很 多 时 候 ， 做 这 样 一 个 编码 查看 方式 的 切换 束 可 以 解决 
乱码 的 问题 ， 但 有 的 时 候 这 样 是 不 够 的 。 


2. 错 误 的 解析 和 编码 转换 








如 果 怎 么 改变 碍 看 方式 都 不 对 ， 那 很 有 可 能 吏 不 仅仅 是 解析 二 进 制 
的 方式 不 对 ， 而 是 文本 在 错误 解析 的 基础 上 还 进行 了 编码 转换 。 我 们 举 
个 例子 来 说 明 : 


1) 两 个 字 “ 老 马 ”， 本 来 的 编码 格式 是 GB18030， 编 码 〈 十 六 进 
制 ) 是 COCF C2ED。 


2) 这 个 二 进 制 形式 被 错误 当成 了 Windows-1252 编 码 ， 解 读 成 了 字 
符 “AIiAf”。 


3) 随后 这 个 字符 进行 了 编码 转换 ， 转 换 成 了 UTF-8 编 码 ， 形 式 还 
是 “ ATAf”， 但 二 进 制 变 成 了 C380C38F C382C3AD， 每 个 字符 两 个 字 
i 





4) 这 个 时 候 再 按照 GB18030 解 析 ， 字 符 就 变 成 了 乱码 形式 “用 腔 胸 
锦 ”， 而 且 这 时 无 论 怎么 切换 查看 编码 的 方式 ， 这 个 二 进 制 看 起 来 都 是 
乱码 。 


这 种 情况 是 乱码 产生 的 主要 原因 。 


这 种 情况 其 实 很 常见， 计算机 程序 为 了 便于 统一 处 理 ， 经 第 会 将 所 

有 编码 转换 为 一 种 方式 ， 比 如 UTF-8， 在 转换 的 时 候 ， 需 要 知道 原来 的 

编码 是 什么 ， 但 可 能 会 搞 错 ， 而 一 旦 搞 错 并 进行 了 转换 ， 就 会 出 现 这 种 

J 这 种 情况 下 ， 无 论 怎么 切换 得 看 编码 方式 都 是 不 行 的 ， 如 表 2-8 
外。 





表 2-8 用 不 同 编码 方式 查看 错误 转换 后 的 二 进 制 


上 六 进 制 G3 50 CEE 321C3 AD 脾 肥 胸 饮 
UTF-8 ig5 @@@ 重 


Windows-1252 





虽然 有 这 么 多 形式 ， 但 我 们 看 到 的 乱码 形式 很 可 能 是 “ AIAf”， 因 为 
在 例子 中 UTF-8 是 编码 转换 的 目标 编码 格式 ， 既 然 转换 为 了 UTF-8， 一 
般 也 是 要 按 UTF-8 查 看 。 


那 有 没有 办 法 恢复 呢 ? 如 条 有 ， 怎 么 恢复 呢 ? 





2.3.5 “从 乱码 中 恢复 








二 “主要 普 误 的 编码 转换 ， 所 请 恢复 ， 是 指 要 恢 
复 两 个 关键 信息 : 是 原来 的 二 进 制 编码 方式 A; 为 一 个 是 错误 解读 
的 编码 方式 B。 


恢复 的 基本 思路 是 党 试 进行 逆 癌 操作 ， 假 定 按 一 种 编码 转换 方式 B 
获取 乱码 的 二 进 制 格式 ， 然 后 再 假定 一 种 编码 解读 方式 A 解 读 这 个 二 进 
制 ， 查 看 其 看 上 去 的 形式 ， 这 要 尝试 多 种 编码 ， 如 果 能 找到 看 着 正常 的 
字符 形式 ， 应 该 束 可 以 恢复 。 

这 听 上 去 可 能 比较 抽象 ， 我 们 举 个 例子 来 说 明 ， 假 定 乱码 形式 
是 “ATAf”， 尝 试 多 种 B 和 A 来 看 字符 形式 。 我 们 先 使 用 编辑 器 ， 以 
UltraEdit 为 例 ， 然 后 使 用 Java 编 程 来 看 。 


1. 使 用 UltraEdit 


UltraEdit 支 持 编码 转换 和 切换 查看 编码 方式 ， 也 支持 文件 的 二 进 制 
3 所 以 我 们 以 UltraEdit 为 例 ， 其 他 一 些 编辑 右 可 能 也 有 类 似 
L 能 。 


新 建 一 个 UTF-8 编 码 的 文件 ， 复 制 “AiAfP 到 文件 中 。 使 用 编码 转 


换 ， 转 换 到 Win-dows-1252 编 码 ， 执 行 “ 文 件 ” 一 “转换 到 ”~ 
欧 ” ~“ WIN-1252 命 令 。 


转换 完 后 ， 打 开 十 六 进 制 编辑 ， 碍 看 其 二 进 制 形式 ， 如 图 2-4 所 











项 乱 Lb” 


En 区 区 站 | 


自动 换行 列 模式 十 六 进 制 编辑 查找 文本 查找 上 一 个 查找 下 一 个 蔡 





图 2-4 ”使 用 UltraEdit 查 看 二 进 制 
可 以 看 出 ， 其 形式 还 是 “AIAf" 但 二 进 制 格式 变 成 了 COCF C2ED。 这 


个 过 程 相当 于 假设 B 是 Windows-1252。 这 个 时 候 ， 再 按照 多 种 编码 格式 
查看 这 个 二 进 制 ， 在 UltraEdit 中 ， 关 闭 十 六 进 制 编辑 ， 切 换 查 看 编码 方 
式 为 GB18030， 执 行 “ 视 图 ” “查看 方式 〈 文 件 编码 ) ”~ “东亚 语 

言 ””GB18030 命 令 ， 切 换 完 后 ， 同 样 的 二 进 制 神奇 地 变 为 了 正确 的 字 
符 形式 “ 老 马 ”， 打 开 十 六 进 制 编辑 器 ， 可 以 看 出 二 进 制 还 是 COCEF 
C2ED， 这 个 GB18030 相 当 于 假设 A 是 GB18030。 


这 个 例子 我 们 碰巧 第 一 次 就 猪 对 了 。 实 际 中 ， 可 能 要 做 多 次 尝试 ， 
过 程 是 类 似 的 ， 先 进行 编码 转换 (使 用 BB 编码) ， 然 后 使 用 不 同 编码 方 
式 查 看 (使 用 A 编码 ) ， 如 果 能 找到 看 上 去 对 的 形式 ， 束 恢复 了 。 表 2-9 
了 主要 的 B 编 码 格式 、 对 应 的 二 进 制 ， 以 及 按 A 编 码 解读 的 各 种 形 
工 No 


表 2-9 ”尝试 不 同 编码 方式 进行 恢复 


TE TE 


81 30 86 38 81 30 88 33 81 30 


GB18030 Windows-1252 ?704+8?0"3?0+0"… 


8730A8AA 





81 30 86 38 81 30 88 33 81 30 
GB18030 Big5 ?22???? 赤 
87 30A8AA 


81308638813088338130 


GB18030 UTF-8 ?0787?0737?30?07? 





8730A8AA 


Big5 Windows-1252 2 
Us TI 
UTF-S ?7? 稳 


可 以 看 出 ， 第 一 行 是 正确 的 ， 也 就 是 说 原来 的 编码 其 实 是 A 即 
GB18030， 但 被 错误 解读 成 了 B 即 Windows-1252 了 。 


2. 使 用 Java 
下 面 我 们 来 看 如 何 使 用 Java 恢 复 乱 码 。 关 于 使 用 Java 我 们 还 有 很 多 


知识 没有 介绍 ， 为 了 完整 性 起 见 ， 本 节 一 并 列 出 相关 代码 ， 初 学 者 不 明 
日 的 可 以 暂时 略 过 。Java 中 人 处理 字符 串 的 类 有 String，String 中 有 我 们 需 





要 的 两 个 重要 方法 。 
1) public byte[]getBytes (String charsetName) ， 这 个 方法 可 以 获取 
一 个 字符 串 的 给 定编 码 格式 的 二 进 制 形式 。 


2) public String (byte bytes[]，String charsetName) ， 这 个 构造 方 
法 以 给 定 的 二 进 制 数组 bytes 按 照 编 码 格式 charsetName 解 读 为 一 个 字符 


O 


将 A 看 作 GB18030， 将 B 看 作 Windows-1252， 进 行 恢复 的 Java 代 码 
如 下 所 示 : 





String str = "AiAi",; 
String newStr = new String(str.getBytes("windows-1252"),"GB18030"); 
System,out.println(newStr )， 





先 按照 B 编 码 (Windows-1252)〉 获取 字符 串 的 二 进 制 ， 然 后 按 A 编 
码 (GB18030) 解读 这 个 二 进 制 ， 得 到 一 个 新 的 字符 串 ， 然 后 输出 这 个 
字符 串 的 形式 ， 输 出 为 “ 老 马 ”。 

同样 ， 一 次 碰巧 就 对 了 ， 实 际 中 ， 我 们 可 以 写 一 个 循环 ， 测 试 不 同 
的 A/B 编 码 中 的 结果 形式 ， 如 代码 清单 2-1 所 示 。 


代码 清 蛙 2-1 恢复 乱码 的 方法 





public static void recover(String str) 
throws UnsupportedEncodingException{ 
String[] charsets = new String[]{ 
"windows-1252", "GB18030", "Big5", "UTF-8"}; 
for(int i=0;i<charsets.length;i++)t{ 
for(int j=0;j<charsets.1length;]j++){ 


if(i!=j){ 
String s = new String(str.getBytes(charsets[i]),charsets[j]); 
System.out.println("---- 原来 编码 (A) 假 设 是 : " 


+Ccharsets[j]+"， 被 错误 解读 为 了 (B): "+charsets[i]); 
System,.out.printin(s); 
System.out.printin(); 





以 上 代码 使 用 不 同 的 编码 格式 进行 测试 ， 如 果 输 出 有 正确 的 ， 那 么 


就 可 以 恢复 。 


可 以 看 出 ， 恢 复 的 尝试 需要 进行 很 多 次 ， 上 面 例子 尝试 了 常见 编码 
GB18030、Windows 1252、Big5、UTF-8 共 12 种 组 合 。 这 4 种 编码 是 常见 
2 在 大 部 分 实际 应 用 中 应 该 够 了 。 如 果 有 其 他 编码 ， 可 以 增加 一 些 
二 Wo 

不 是 所 有 的 乱码 形式 都 是 可 以 恢复 的 ， 如 果 形 式 中 有 很 多 不 能 识别 
的 字符 (如 ? ) ， 则 很 难 恢复 。 另 外 ， 如 果 乱 码 是 由 于 进行 了 多 次 解析 
和 转换 错误 造成 的 ， 也 很 难 恢 复 。 























2.4 ” char 的 真正 含义 


通过 前 面 小 节 ， 我 们 应 该 对 字符 和 文本 的 编码 和 乱码 有 了 一 个 清晰 
的 认识 ， 但 前 面 小 节 基 本 是 与 编程 语言 无 关 的 ， 我 们 还 是 不 知道 怎么 在 
程序 中 处理 字符 和 文本 。 本 节 讨 论 在 Java 中 进行 字符 处 理 的 基础 char， 
Java 中 还 有 Character、String、StringBuilder 等 类 用 于 文本 人 处理， 它们 的 
基础 都 是 char， 我 们 在 第 7 章 再 介绍 这 些 类 。 


char 看 上 去 是 很 简单 的 ， 正 如 我 们 在 1.2 节 所 说 ，char 用 于 表示 一 个 
字符 ， 这 个 字符 可 以 是 中 文字 符 ， 也 可 以 是 英文 字符 。 赋 值 时 把 常量 字 
符 用 单 引 号 括 起 来 ， 例 如 : 

















char c = 'A'，; 
char z = ' 杞 '，; 





但 为 什么 字符 类 型 也 可 以 进行 算术 运算 和 比较 昵 ? 它 的 本 质 到 底 是 
什么 呢 ? 


在 Java 内 部 进行 字符 处 理 时 ， 采 用 的 都 是 Unicode， 具 体 编码 格式 是 
UTF-16BE。 简 单 回 顾 一 下 ，UTF-16 使 用 两 个 或 4 个 字 节 表示 一 个 字 
符 ，Unicode 编 号 范围 在 65536 以 内 的 占 两 个 字 节 ， 超 出 范围 的 占 4 个 字 
人 再 输出 低位 字 节 ， 这 与 整数 的 内 存 表 示 
ZE Jo 


char 本 质 上 是 一 个 固定 占用 两 个 字 贡 的 无 符号 正 整 数 ， 这 个 正 整数 
对 应 于 Unicode 编 号 ， 用 于 表示 那个 Unicode 编 号 对 应 的 字符 。 由 于 固定 
占用 两 个 字 节 ，char 只 能 表示 Unicode 编 号 在 65536 以 内 的 字符 ， 而 不 能 
表示 超出 范围 的 字符 。 那 超出 范围 的 字符 怎么 表示 呢 ? 使 用 两 个 char。 
类 Character、String 有 一 些 相 关 的 方法 ， 我 们 到 第 7 章 再 介绍 。 


在 这 个 认识 的 基础 上 ， 我 们 再 来 看 下 char 的 一 些 行为 。 
char 有 多 种 赋值 方式 : 














3. char c = 39532 
4. char c = Ox9a6c 
5. char c = '\u9a6c' 





第 1 种 赋值 方式 是 最 常见 的 ， 将 一 个 能 用 ASCII 码 表示 的 字符 赋 给 一 
个 字符 变量 。 第 2 种 赋值 方式 也 很 常见 ， 但 这 里 是 个 中 文字 符 ， 需 要 注 
意 的 是 ， 直 接 写字 符 常 量 的 时 候 应 该 注意 文件 的 编码 ， 比 如 ，GBK 编 码 
的 代码 文件 按 UTF-8 打 开 ， 字 符 会 变 成 乱码 ， 赋 值 的 时 候 是 按 当前 的 编 
码 解读 方式 ， 将 这 个 字符 形式 对 应 的 Unicode 编 号 值 赋 给 变量 ,，“ 马 ”对 
应 的 Unicode 编 号 是 39532， 所 以 第 2 种 赋值 方式 和 第 3 种 赋值 方式 是 一 样 
的 。 第 3 种 赋值 方式 是 直接 将 十 进 制 的 常量 赋 给 字符 。 第 4 种 赋值 方式 是 
将 十 六 进 制 常量 赋 给 字符 ， 第 5 种 赋值 方式 是 按 Unicode 字 符 形式 。 所 
以 ， 第 2、3、4、5 种 赋值 方式 都 是 一 样 的 ， 本 质 都 是 将 Unicode 编 号 
39532 赋 给 了 字符 。 


由 于 char 本 质 上 是 一 个 整数 ， 所 以 可 以 进行 整数 能 做 的 一 些 运算 ， 
在 进行 运算 时 会 被 看 作 int， 但 由 于 char 占 两 个 字 节 ， 运 算 结 果 不 能 直接 
赋值 给 char 类 型 ， 需 要 进行 强制 类 型 转换 ， 这 和 byte、short 参 与 整数 运 
算是 类 似 的 。char 类 型 的 比较 就 是 其 Unicode 编 写 的 比较 。 


char 的 加 减 运 算 就 是 按 其 Unicode 编 号 进行 运算 ， 一般 对 字符 做 加 减 
运算 没什么 意义 ， 但 ASCII 码 字符 是 有 意义 的 。 比 如 大 小 写 转 换 ， 大 写 
A 一 2Z 的 编号 是 65 一 90， 小 号 a 一 z 的 编号 是 97 一 122， 正 好 相差 32， 所 以 
大 写 转 小 写 只 需 加 32， 而 小 写 转 大 与 只 需 减 32。 加 减 运算 的 另 一 个 应 用 
是 加 密 和 解密 ， 将 字符 进行 某 种 可 逆 的 数学 运算 可 以 做 加 解密 。 


char 的 位 运算 可 以 看 作 是 对 应 整数 的 位 运算 ， 只 是 它 是 无 符号 数 ， 
也 就 是 说 ， 有 符 写 右 移 >> 和 无 符 写 右 移 >>> 的 结果 是 一 样 的 。 既 然 char 
本 质 上 是 整数 ， 碍 看 char 的 二 进 制 表 示 ， 同 样 可 以 用 Integer 的 方法 ， 如 
FIT 
































char c = ' 马 '; 
System,out.println(Integer,toBinaryString(c) )， 





输出 为 : 





1001101001101100 





人 至此， 关于 整数 、 小 数 以 及 字符 的 二 进 制 表示 就 介绍 完了 ， 下 一 章 
让 我 们 一 起 来 探索 类 的 世界 。 


面 问 对 象 
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常用 基础 类 








第 7 章 


第 3 章 ”类 的 基础 


程序 主要 就 是 数据 以 及 对 数据 的 操作 ， 为 方便 理解 和 操作 ， 高 级 语 
言 使 用 数据 类 型 这 个 概念 ， 不 同 的 数据 类 型 有 不 同 的 特征 和 操作 ，Java 
定义 了 8 种 基本 数据 类 型 : 4 种 整 型 byte、short、int、long， 两 种 浮 点 类 
型 float、double， 一 种 真 假 类 型 boolean， 一 种 字符 类 型 char。 其 他 类 型 
的 数据 都 用 类 这 个 概念 表达 。 


类 比较 复杂 ， 本 章 主要 介绍 类 的 一 些 基础 知识 ， 有 具体 分 为 3 节 : 3.1 
市 主要 介绍 类 的 基本 概念 ;3.2 节 主要 通过 一 些 例子 来 演示 如 何 将 一 些 
现实 概念 和 问题 通过 类 以 及 类 的 组 合 来 表示 和 处 理 ，3.3 节 介绍 类 代码 
的 组 织 机 制 。 





3.1 类 的 基本 概念 

在 第 1 章 ， 我 们 暂时 将 类 看 作 函 数 的 容器 ， 在 某 些 情况 下 ， 类 也 确 
实 只 是 函数 的 容器 ， 但 类 更 多 表示 的 是 自 定 义 数据 类 型 。 本 节 我 们 先 
从 容器 的 角度 ， 然 后 从 自 定义 数据 类 型 的 角度 介绍 类 。 


3.1.1 ”函数 容器 





我 们 看 个 例子 Java API 中 的 类 Math， 它 里 面 主 要 包含 了 和 若干 数 
学 函数 ， 表 3-1 列 出 了 其 中 一 些 。 


要 使 用 这 些 函 数 ， 直 接 在 前 面 加 Math. 即 可 ， 例 如 Math.abs (-1) 返 
回 1。 这 些 函 数 都 有 相同 的 修饰 符 : public static。 static 表 示 类 方法 ， 也 
叫 静 态 方法 ， 与 类 方法 相对 的 是 实例 方法 。 实 例 方法 没有 static 修 饰 
符 ， 必 须 通过 实例 或 者 对 象 调用 ， 而 类 方法 可 以 直接 通过 类 名 进行 调 
不 需要 创建 实例 。public 表 示 这 些 函 数 是 公开 的 ， 可 以 在 任何 地 方 
被 外 部 调用 。 











表 3-1 ”Math 类 的 常用 函数 


Math 函数 Math 函数 功 


四 
[3 


int round(float a) 四 舍 五 入 int abs(int a) 绝对 值 







double sqrt(double a) int max(int a, intb) | 最 大 值 
double ceil(double a) 回 上 取 整 double log(double a) | 自然 对 数 


double floor(double a) double random() 产生 一 个 大 于 等 于 0 小 于 1 的 随机 数 


double pow(double a, double b) a 的 b 次 方 


与 public 相 对 的 是 private。 如 果 是 private， 则 表示 私有 ， 这 个 函数 只 
能 在 同一 个 类 内 被 别 的 函数 调用 ， 而 不 能 被 外 部 的 类 调用 。 在 Math 类 
中 ， 有 一 个 函数 Random initRNG 〈) 就 是 private 的 ， 这 个 函数 被 public 
J () 调用 以 生成 随机 数 ， 但 不 能 在 Math 类 以 外 的 地 方 被 调 








将 函数 声明 为 private 可 以 避免 该 函数 被 外 部 类 误 用 ， 调 用 者 可 以 清 
楚 地 知道 哪些 函数 是 可 以 调用 的 ， 哪 些 是 不 可 以 调用 的 。 类 实现 者 通过 


private 函 数 封 半 和 隐藏 内 部 实现 细节 ， 而 调用 者 只 需要 关心 public 就 可 
以 了 o 可 以 说 》 通过 private 封 装 和 隐藏 内 部 实现 细节 ? 避免 被 误 操 作 9 
是 计算 机 程序 的 一 种 基本 思维 方式 。 


除了 Math 类 ， 我 们 再 来 看 一 个 例子 Arrays。Arrays 里 面包 含 很 多 与 
数组 操作 相关 的 函数 ， 表 3-2 列 出 了 其 中 一 些 。 


表 3-2 Arrays 类 的 一 些 函 数 


Arrays 函数 功 能 
void sort(int[] a) 排序 ， 按 升序 排 ， 整 数 数组 
void sort(double[] a) 排序 ， 按 升序 排 ， 浮 点 数 数组 
int binarySearch(long[] a, long key) -分 查找 ， 数 组 已 按 升序 排列 
void fill(int[] a, int val) 给 所 有 数组 元 素 赋 相同 的 值 
int[] copyOfGnt[] original, int newLength) 数组 复制 
boolean equals(char[] a. char[] a2) 判断 两 个 数组 是 否 相 同 


这 里 将 类 看 作 函 数 的 容器 ， 更 多 的 是 从 语言 实现 的 角度 看 ， 从 概念 
的 角度 看 ，Math 和 Arrays 也 可 以 看 作 目 定义 数据 类 型 ， 分 别 表 示 数 学 和 
数组 类 型 ， 其 中 的 public static 函 数 可 以 看 作 类 型 能 进行 的 操作 。 接 下 来 
更 为 详细 地 讨论 目 定 义 数据 类 型 。 


3.1.2” 目 定义 数据 类 型 


我 们 将 类 看 作 目 定义 数据 类 型 ， 所 谓 自 定义 数据 类 型 束 是 除了 8 种 
基本 类 型 以 外 的 其 他 类 型 ， 用 于 表示 和 处 理 基本 类 型 以 外 的 其 他 数据 。 
一 个 数据 类 型 由 其 包含 的 属性 以 及 该 类 型 可 以 进行 的 操作 组 成 ， 属 性 又 
可 以 分 为 是 类 型 本 身 具 有 的 属性 ， 还 是 一 个 具体 实例 具有 的 属性 ， 同 
样 ， 操 作 也 可 以 分 为 是 类 型 本 里 可 以 进行 的 操作 ， 还 是 一 个 具体 实例 可 
以 进行 的 操作 。 


这 样 ， 一 个 数据 类 型 就 主要 由 4 部 分 组 成 : 
类 型 本 和 喘 具有 的 属性 ， 通 过 类 变量 体现 。 
类 型 本 身 可 以 进行 的 操作 ， 通 过 类 方法 体现 。 




















类 型 实例 具有 的 属性 ， 通 过 实例 变量 体现 。 
类 型 实例 可 以 进行 的 操作 ， 通 过 实例 方法 体现 。 
每 一 


不 过 ， 对 于 一 个 具体 类 型 ， 个 部 分 不 一 定 都 有 ，Arrays 类 就 只 
有 类 方 ; 

类 变量 和 实例 变量 都 叫 成 员 变 量 ， 也 就 是 类 的 成 员 ， 类 变量 也 叫 
静态 变量 或 静态 成 员 变 量 。 类 方法 和 实例 方法 都 叫 成 员 方 法 ， 也 都 是 
类 的 成 员 ， 类 方法 也 叫 静态 方法 。 


类 方法 我 们 上 面 已 经 看 过 了 ，Math 和 Arrays 类 中 定义 的 方法 就 是 类 
方法 ， 这 些 方法 的 修饰 符 必须 有 static。 下 面 解 释 类 变量 、 实 例 变 量 和 实 
例 方法 。 


1. 类 变量 


类 型 本 身 具 有 的 属性 通过 类 变量 体现 ， 经 常用 于 表示 一 个 类 型 中 的 
和 常量。 比如 Math 类 ， 定 义 了 两 个 数学 中 常用 的 常量 ， 如 下 所 示 : 



































public static final double E = 2.7182818284590452354; 
public static final double PI = 3.14159265358979323846; 











E 表 示 数 学 中 自然 对 数 的 底数 ， 目 然 对 数 在 很 多 学 科 中 有 重要 的 意 
义 ; PI 表示 数学 中 的 圆周 率 。 与 类 方法 一 样 ， 类 变量 可 以 直接 通过 类 名 
访问 ， 如 Math.PI。 








这 两 个 变量 的 修饰 符 也 都 有 public static，public 表 示 外 部 可 以 访 
问 ，static 表 示 是 类 变量 。 与 public 相 对 的 也 是 private， 表 示 变 量 只 能 在 
类 内 被 访问 。 与 static 相 对 的 是 实例 变量 ， 没 有 static 修 饰 符 。 


这 里 多 了 一 个 修饰 符 final，final 在 修饰 变量 的 时 候 表 示 常 量 ， 即 变 
量 赋值 后 就 不 能 再 修改 了 。 使 用 final 可 以 避免 误 操 作 ， 比 如 ， 如 果 有 人 
不 小 心 将 Math.PI 的 值 改 了 ， 那 么 很 多 相关 的 计算 就 会 出 错 。 男 外 ，Java 
编译 器 可 以 对 final 变 量 进行 一 些 特别 的 优化 。 所 以 ， 如 果 数 据 赋值 后 就 
不 应 该 再 变 了 ， 就 加 final 修 饰 符 。 


表示 类 变量 的 时 候 ，static 修 饰 符 是 必需 的 ， 但 public 和 final 都 不 是 

















必需 的 。 
2. 实 例 变量 和 实例 方法 


所 谓 实例 ， 字 面 意思 就 是 一 个 实际 的 例子 。 实 例 变量 表示 具体 的 实 
例 所 具有 的 属性 ， 实 例 方法 表示 其 体 的 实例 可 以 进行 的 操作 。 如 果 将 微 
信 订 阅 号 看 作 一 个 类 型 ， 那 “ 老 马 说 编程 ?订阅 号 束 是 一 个 实例 ， 订 阅 号 
的 头像 、 功 能 介绍 、 发 布 的 文章 可 以 看 作 实例 变量 ， 而 修改 头像 、 修 改 
功能 介绍 、 发 布 新 文章 可 以 看 作 实例 方法 。 与 基本 类 型 对 比 , “int 
a; ”这 个 语句 中 ，int 就 是 类 型 ， 而 a 束 古 实例 。 


接 下 来 ， 我 们 通过 定义 和 使 用 类 来 进一步 理解 目 定义 数据 类 型 。 




















313 是 义 帅 一 个 大 





我 们 定义 一 个 简单 的 类 ， 表 示 在 平面 坐标 轴 中 的 一 个 点 ， 代 码 如 
下 : 





class Point { 
public int x; 
public int y; 
public double distance(){ 
return Math,.sqrt(x*x+y*y); 
} 


} 





我 们 来 解释 一 下 : 





public class Point 





表示 类 型 的 名 字 是 Point， 是 可 以 被 外 部 公开 访问 的 。 这 个 public 修 
饰 似乎 是 多 余 的 ， 不 能 被 外 部 访问 还 能 有 什么 用 ? 在 这 里 ， 确 实 不 能 
private 修 饰 Point。 但 修饰 符 可 以 没有 【〔 即 留 空 ) ， 表 示 一 种 包 级 别 的 可 
见 性 ， 关 于 包 ，3.3 节 再 介绍 。 男 外 ， 类 可 以 定义 在 一 个 类 的 内 部 ， 这 
时 可 以 使 用 private 修 饰 符 ， 关 于 内 部 类 我 们 在 第 5 章 介 绍 。 





public int x; 
public int y; 


定义 了 两 个 实例 变量 x 和 y， 分 别 表 示 X 坐 标 和 y 坐 标 ， 与 类 变量 类 
似 ， 修 饰 符 也 有 public 或 private 修 饰 符 ， 表 示人 含义 类 似 ，public 表 示 可 被 
外 部 访问 ， 而 private 表 示 私 有 ， 不 能 直接 被 外 部 访问 ， 实 例 变 量 不 能 
static 修 饰 符 。 





public double distance(){ 
return Math,.sqrt(x*xt+y*y); 
} 





定义 了 实例 方法 distance， 表 示 该 点 到 坐标 原点 的 距离 。 该 方法 可 
以 直接 访问 实例 变量 x 和 y， 这 是 实例 方法 和 类 方法 的 最 大 区 别 。 实 例 方 
法 直接 访问 实例 变量 ， 到 底 是 什么 意思 呢 ? 其 实 ， 在 实例 方法 中 ， 有 一 
个 隐 含 的 参数 ， 这 个 参数 就 是 当前 操作 的 实例 上 自己， 直接 操作 实例 变 
量 ， 实 际 也 需要 通过 参数 进行 。 实 例 方法 和 类 方法 的 更 多 区 别 如 下 所 
外。 

















-类 方法 只 能 访问 类 变量 ， 不 能 访问 实例 变量 ， 可 以 调用 其 他 的 类 
方法 ， 不 能 调用 实例 方法 。 


实例 方法 既 能 访问 实例 变量 ， 也 能 访问 类 变量 ， 既 可 以 调用 实例 
方法 ， 也 可 以 调用 类 方法 。 


如 果 这 些 让 你 感到 困惑 ， 没 有 关系 ， 关 于 实例 方法 和 类 方法 的 更 多 
细节 ， 后 续 会 进一步 介绍 。 


3.14 使 用 第 一 个 类 


定义 了 类 本 喘 和 定义 了 一 个 函数 类 似 ， 本 刁 不 会 做 什么 事情 ， 不 会 
分 配 内 存 ， 也 不 会 执行 代码 。 方 法 要 执行 需要 被 调用 ， 而 实例 方法 航 调 
用 ， 首 先 需 要 一 个 实例 。 实 例 也 称 为 对 象 ， 我 们 可 能 会 交 蔡 使 用 。 下 面 
的 代码 演示 了 如 何 使 用 : 





public static void main(String[] args) { 
Point p = new Point(); 
p.x = 2; 


p:y / 
System,out.println(p.distance() ); 





我 们 解释 一 下 : 
Point p = new Point(); 


这 个 语句 包含 了 Point 类 型 的 变量 声明 和 赋值 ， 它 可 以 分 为 两 部 分 : 





1 Point p; 
2 p= new Point(); 





Point p 声 明了 一 个 变量 ， 这 个 变量 叫 p， 是 Point 类 型 的 。 这 个 变量 
和 数组 变量 是 类 似 的 ， 部 有 两 块 内 存 : 一 块 存放 实际 内 容 ， 一 块 存放 实 
际 内 容 的 位 置 。 声 明 变 量 本 身 只 会 分 配 存放 位 置 的 内 存 空间 ， 这 块 空间 
还 没有 指向 任何 实际 内 容 。 因为 这 种 变量 和 数组 变量 本 身 不 存储 数 
据 ， 而 只 是 存储 实际 内 容 的 位 置 ， 它 们 也 都 称 为 引用 类 型 的 变量 。 


p=new Point《) ; 创建 了 一 个 实例 或 对 象 ， 然 后 赋值 给 了 Point 类 型 
的 变量 p， 它 至 少 做 了 两 件 事 : 


1) 分 配 内 存 ， 以 存储 新 对 象 的 数据 ， 对 象 数据 包括 这 个 对 象 的 属 
性 ， 有 基体 包括 其 实例 变量 x 和 y。 


2) 给 实例 变量 设置 默认 值 ，int 类 型 默认 值 为 0。 


与 方法 内 定义 的 局 部 变量 不 同 ， 在 创建 对 象 的 时 候 ， 所 有 的 实例 变 
量 都 会 分 配 一 个 默认 值 ， 这 与 创建 数组 的 时 候 是 类 似 的 ， 数 值 类 型 变量 
的 默认 值 是 0，boolean 是 false，char 是 “\u0000”， 引 用 类 型 变量 都 是 
null。null 是 一 个 特殊 的 值 ， 表 示 不 指 同 任何 对 象 。 这 些 默 认 值 可 以 修 
改 ， 我 们 稍 后 介绍 。 














ll 


p.x = 2; 
py = 3; 





给 对 象 的 变量 赋值 ， 语 法 形式 是 : < 对 象 变量 名 >.< 成 员 名 >。 





System.out.println(p.distance()); 





调用 实例 方法 distance， 并 输出 结果 ， 语 法 形式 是 :< 对 象 变 量 名 >. 
0 
和 数据。 


我 们 在 介绍 基本 类 型 的 时 候 ， 先 定义 数据 ， 然 后 赋值 ， 最 后 是 操 
作 ， 目 定义 类 型 与 此 类 似 : 


Point p=new Point () ; 是 定义 数据 并 设置 默认 值 。 
'D.x=2; p.y=3; 是 赋值 。 
.p.distance () 是 数据 的 操作 。 


可 以 看 出 ， 对 实例 变量 和 实例 方法 的 访问 都 通过 对 象 进行 ， 通 过 对 
象 来 访问 和 操作 其 内 部 的 数据 是 一 种 基本 的 面 问 对 象 思维 。 本 例 中 ， 
我 们 通过 对 象 直接 操作 了 其 内 部 数据 xz 和 y， 这 是 一 个 不 好 的 习惯 ， 一 般 
而 言 ， 不 应 该 将 实例 变量 声明 为 public， 而 只 应 该 通过 对 象 的 方法 对 实 
例 变量 进行 操作 。 这 也 是 为 了 减少 误 操 作 ， 直 接 访问 变量 没有 办 法 进 
行 参数 检查 和 控制 ， 而 通过 方法 修改 ， 可 以 在 方法 中 进行 检查 。 

















3.1.5 ”变量 默认 值 


之 前 我 们 说 实例 变量 都 有 一 个 默认 值 ， 如 果 希 望 修 改 这 个 默认 值 ， 
可 以 在 定义 变量 的 同时 就 赋值 ， 或 者 将 代码 放 入 初始 化 代码 块 中 ， 代 码 
块 用 人 包围， 如 下 所 示 : 





int x = 1; 
int y; 
{ 

y= 2; 
} 





x 的 默认 值 设 为 了 1，y 的 默认 值 设 为 了 2。 在 新 建 一 个 对 象 的 时 候 ， 
会 先 调 用 这 个 初始 化 ， 然 后 才 会 执行 构造 方法 中 的 代码 ， 关 于 构造 方 
法 ， 我 们 稍 后 介绍 。 


静态 变量 也 可 以 这 样 初始 化 : 





static int STATIC ONE = 1; 
static int STATIC_TWO,; 
static 


STATIC_TWO = 2,， 





STATIC_TWO=2; 语句 外 面包 了 一 个 static{}， 这 叫 静 态 初 始 化 代 
码 块 。 静 态 初 始 化 代码 块 在 类 加 载 的 时 候 执 行 ， 这 是 在 任何 对 象 创 建 之 
前 ， 且 只 执行 一 次 。 





3.1.6”_ private 变量 


前 面 我 们 说 一 般 不 应 该 将 实例 变量 声明 为 public， 下 面 我 们 修改 一 
下 类 的 定义 ， 将 实例 变量 定义 为 private， 通 过 实例 方法 来 操作 变量 ， 如 
代码 清单 3-1 所 示 。 


代码 清单 3-1 Point 类 定义 一 一 实例 变量 定义 为 private 








class Point { 
private int x; 
private int y; 
public void setXx(int x) { 
this.x = x; 


} 
public void setY(int y) { 
this.y = y; 


} 
public int getX() { 
return x; 


} 
public int getY() { 
return y; 


} 
public double distance() { 
return Math.sqrt(x * x+y * y); 





这 个 定义 中 ， 我 们 加 了 4 个 方法 ，setX/setY 用 于 设置 实例 变量 的 
值 ，getX/getY 用 于 获取 实例 变量 的 值 。 





这 里 面 需要 介绍 的 是 this 这 个 关键 字 。this 表 示 当 前 实例 ， 在 语句 
this.x=x; 中 ，this.x 表 示 实 例 变量 x， 而 右边 的 x 表示 方法 参数 中 的 x。 前 
面 我 们 提 到 ， 在 实例 方法 中 ， 有 一 个 隐 仿 的 参数 ， 这 个 参数 束 是 this， 
没有 上 收 义 的 情况 下 ， 可 以 直接 访问 实例 变量 ， 在 这 个 例子 中 ， 两 个 变量 
名 都 叫 x， 则 需要 通过 加 上 this 来 消除 收 义 。 


这 4 个 方法 看 上 去 是 非常 多 余 的 ， 直 接 访问 变量 不 是 更 简洁 吗 ? 而 
且 第 1 间 我 们 也 说 过 ， 函 数 调用 是 有 成 本 的 。 在 这 个 例子 中 ， 意 义 确实 
不 太 大 ， 实 际 上 ，Java 编 译 器 一 般 也 会 将 对 这 几 个 方法 的 调用 转换 为 直 
接 访问 实例 变量 ， 而 避免 函数 调用 的 开销 。 但 在 很 多 情况 下 ， 通 过 函数 
ee 避免 误 操 作 ， 我 们 一 般 还 是 不 将 成 员 变 量 定义 
为 public 。 


使 用 这 个 类 的 代码 如 下 : 



































public static void main(String[] args) { 
Point p = new Point(); 
p.setxX(2); 
p.setyY(3); 
System.out.printiln(p.distance( )); 

} 








上 述 代码 将 对 实例 变量 的 直接 访问 改 为 了 方法 调用 。 


.17 构造 方法 





在 初始 化 对 象 的 时 候 ， 前 面 我 们 都 是 直接 对 每 个 变量 赋值 ， 有 一 个 
更 简单 的 方式 对 实例 变量 赋 初 值 ， 就 是 构造 方法 ， 我 们 先 看 下 代码 。 在 
Point 类 定义 中 增加 如 下 代码 : 








public Point(){ 
this(0,0); 


} 

public Point(int x, int y)t{ 
this.x = x; 
this.y = y; 

} 





这 两 个 就 是 构造 方法 ， 构 造 方法 可 以 有 多 个 。 不 同 于 一 般 方 法 ， 构 


造 方法 有 一 些 特 殊 的 地 方 : 


1) 名 称 是 固定 的 ， 与 类 名 相同 。 这 也 容易 理解 ， 徘 这 个 用 户 和 
Java 系 统 就 都 能 容易 地 知道 哪些 是 构造 方法 。 


2) 没有 返回 值 ， 也 不 能 有 返回 值 。 构 造 方 法 隐 含 的 返回 值 就 是 实 
例 本 身 。 


与 普通 方法 一 样 ， 构 造 方法 也 可 以 重 载 。 第 二 个 构造 方法 是 比较 容 
易 理 解 的 ， 使 用 this 对 实例 变量 赋值 。 


我 们 解释 下 第 一 个 构造 方法 ，this (0，0) 的 意思 是 调用 第 二 个 构 
造 方法 ， 并 传递 参数 “0，0”， 我 们 前 面 解释 说 this 表 示 当 前 实例 ， 可 以 
通过 this 访 问 实 例 变 量 ， 这 是 this 的 第 二 个 用 法 ， 用 于 在 构造 方法 中 调用 
其 他 构造 方法 。 


这 个 this 调 用 必须 放 在 第 一 行 ， 这 个 规定 也 是 为 了 避免 误 操 作 。 构 
造 方法 是 用 于 初始 化 对 象 的 ， 如 果 要 调用 别 的 构造 方法 ， 先 调 别 的 ， 然 
后 根据 情况 自己 再 做 调整 ， 而 如 果 自 己 先 初 始 化 了 一 部 分 ， 再 调 别 的 ， 
目 己 的 修改 可 能 束 补 窗 盖 了 。 

这 个 例子 中 ， 不 带 参 数 的 构造 方法 通过 this (0，0) 又 调用 了 第 二 
个 构造 方法 ， 这 个 调用 是 多 余 的 ， 因 为 x 和 y 的 默认 值 束 是 9， 不 需要 再 
单独 赋值 ， 我 们 这 里 主要 是 演示 其 语法 。 


我 们 来 看 下 如 何 使 用 构造 方法 ， 代 码 如 下 : 

















Point p = new Point(2,3); 


这 个 调用 就 可 以 将 实例 变量 x 和 y 的 值 设 为 2 和 3。 前 面 我 们 介绍 new 
Point 〈) 的 时 候 说 ， 它 至 少 做 了 两 件 事 ， 一 件 是 分 配 内 存 ， 男 一 件 是 给 
实例 变量 设置 默认 值 ， 这 里 我 们 需要 加 上 一 件 事 ， 束 是 调用 构造 方法 。 
调用 构造 方法 是 new 操 作 的 一 部 分 。 

通过 构造 方法 ， 可 以 更 为 简洁 地 对 实例 变量 进行 赋值 。 关 于 构造 方 


法 ， 下 面 我 们 讨论 两 个 细节 概念 : 一 个 是 默认 构造 方法 ， 另 一 个 是 私有 
构造 方法 。 














1. 默 认 构 造 方法 


每 个 类 都 至 少 要 有 一 个 构造 方法 ， 在 通过 new 创 建 对 象 的 过 程 中 会 
被 调用 。 但 构造 方法 如 果 没 什么 操作 要 做 ， 可 以 省 略 。Java 编 译 需 会 目 
动 生成 一 个 默认 构造 方法 ， 也 没有 具体 操作 。 但 一 旦 定义 了 构造 方法 ， 
Java 就 不 会 再 自动 生成 默认 的 ， 具 体 什么 意思 呢 ? 在 这 个 例子 中 ， 如 果 
我 们 只 定义 了 第 二 个 构造 方法 〈 带 参数 的 ) ， 则 下 面 语句 : 











Point p = new Point(); 


束 会 报错 ， 因 为 找 不 到 不 带 参 数 的 构造 方法 。 


为 什么 Java 有 时 候 上 自动 生成 ， 有 时 候 不 生成 呢 ? 在 没有 定义 任何 构 
造 方 法 的 时 候 ，Java 认 为 用 户 不 需要 ， 所 以 束 生 成 一 个 空 的 以 被 new 过 
程 调用 ;， 定 义 了 构造 方法 的 时 候 ，Java 认 为 用 户 知道 自己 在 干什么 ， 认 
为 用 户 是 有 意 不 想 要 不 带 参 数 的 构造 方法 ， 所 以 不 会 自动 生成 。 


2. 私 有 构造 方法 


构造 方法 可 以 是 私有 方法 ， 即 修饰 符 可 以 为 private， 为 什么 需要 私 
有 构造 方法 呢 ? 大 致 可 能 有 这 人 么 几 种 场景 : 


1) 不 能 创建 类 的 实例 ， 类 只 能 被 静态 访问 ， 如 Math 和 Arrays 类 ， 
它们 的 构造 方法 就 是 私有 的 。 


2) 能 创建 类 的 实例 ， 但 只 能 被 类 的 静态 方法 调用 。 有 一 种 常见 的 
场景 : 类 的 对 象 有 但 是 只 能 有 一 个 ， 即 单 例 〈 单 个 实例 ) 。 在 这 种 场景 
中 ， 对 象 是 通过 静态 方法 获取 的 ， 而 静态 方法 调用 私有 构造 方法 创建 一 
个 对 象 ， 如 果 对 象 已 经 创建 过 了 ， 就 重用 这 个 对 象 。 


3) 只 是 用 来 被 其 他 多 个 构造 方法 调用 ， 用 于 减少 重复 代码 。 


























3.1.8 类 和 对 象 的 生命 周期 





了 解 了 类 和 对 象 的 定义 与 使 用 ， 下 面 我 们 再 从 程序 运行 的 角度 理解 
下 类 和 对 象 的 生命 周期 。 


在 程序 运行 的 时 候 ， 当 第 一 次 通过 new 创 建 一 个 类 的 对 象 时 ， 或 者 
直接 通过 类 名 访问 类 变量 和 类 方法 时 ，Java 会 将 类 加 载 进 内 存 ， 为 这 个 
类 分 配 一 块 空间 ， 这 个 空间 会 包括 类 的 定义 、 它 的 变量 和 方法 信息 ， 同 
时 还 有 类 的 静态 变量 ， 并 对 静态 变量 赋 初 始 值 。 下 一 章 会 进一步 介绍 有 
关 细 市 。 

类 加 载 进 内 存 后 ， 一 般 不 会 释放 ， 直 到 程序 结束 。 一 般 情 况 下 ， 类 
只 会 加 载 一 次 ， 所 以 静态 变量 在 内 存 中 只 有 一 份 。 

当 通 过 new 创 建 一 个 对 象 的 时 候 ， 对 象 产 生 ， 在 内 存 中 ， 会 存储 这 


个 对 象 的 实例 变量 值 ， 每 做 new 操 作 一 次 ， 残 会 产生 一 个 对 象 ， 束 会 有 
一 份 独立 的 实例 变量 。 


每 个 对 象 除了 保存 实例 变量 的 值 外 ， 可 以 理解 为 还 保存 着 对 应 类 型 
即 类 的 地 址 ， 这 样 ， 通 过 对 象 能 知道 它 的 类 ， 访 问 到 类 的 变量 和 方法 代 




















实例 方法 可 以 理解 为 一 个 静态 方法 ， 只 是 多 了 一 个 参数 this。 通 过 
对 象 调 用 方法 ， 可 以 理解 为 就 是 调用 这 个 静态 方法 ， 并 将 对 象 作 为 参数 
传 给 this。 


对 象 的 释放 是 被 Java 用 垃圾 回收 机 制 管理 的 ， 大 部 分 情况 下 ， 我 们 
不 用 太 操 心 ， 当 对 象 不 再 被 使 用 的 时 候 会 被 和 目 动 释放 。 


具体 来 说 ， 对 象 和 数组 一 样 ， 有 两 块 内 存 ， 保 存 地 址 的 部 分 分 配 在 
栈 中 ， 而 保存 实际 内 容 的 部 分 分 配 在 堆 中 。 栈 中 的 内 存 是 自动 管理 的 ， 
函数 调用 入 栈 束 会 分 配 ， 而 出 栈 就 会 释放 。 


堆 中 的 内 存 是 被 垃圾 回收 机 制 党 理 的 ， 当 没有 活跃 变量 指向 对 象 
的 时 候 ， 对 应 的 堆 空 间 就 可 能 被 释放 ， 具 体 释 放 时 间 是 Java 虚 拟 机 目 己 
决定 的 。 活 路 变量 就 是 已 加 载 的 类 的 类 变量 ， 以 及 栈 中 所 有 的 变量 。 





3.1.9 Js 


本 节 我 们 主要 从 目 定 义 数据 类 型 的 角度 介绍 了 类 ， 谈 了 如 何 定 义 和 
使 用 类 。 目 定义 类 型 由 类 变量 、 类 方法 、 实 例 变量 和 实例 方法 组 成 ， 为 
方便 对 实例 变量 赋值 ， 介 绍 了 构造 方法 ， 最 后 介绍 了 类 和 对 象 的 生命 周 




















通过 类 实现 自 定 义 数 据 类 型 ， 封 装 该 类 型 的 数据 所 具有 的 属性 和 操 
作 ， 隐 藏 实现 细节 ， 从 而 在 更 高 的 层次 〈 类 和 对 象 的 层次 ， 而 非 基 本 数 
据 类 型 和 函数 的 层次 ) 上 考虑 和 操作 数据 ， 是 计算 机 程序 解决 复杂 问题 
的 一 种 重要 的 思维 方式 。 

本 节 提 到 了 多 个 关键 字 ， 这 里 汇总 一 下 。 

1) public: 可 以 修饰 类 、 类 方法 、 类 变量 、 实 例 变 量 、 实 例 方 
法 、 构 造 方法 ， 表 示 可 被 外 部 访问 。 

2) private: 可 以 修饰 类 、 类 方法 、 类 变量 、 实 例 变 量 、 实 例 方 
法 、 构 造 方法 ， 表 示 不 可 以 被 外 部 访问 ， 只 能 在 类 内 部 被 使 用 。 


3) static: 修饰 类 变量 和 类 方法 ， 它 也 可 以 修饰 内 部 类 〈5.3 节 介 
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4) this: 表示 当前 实例 ， 可 以 用 于 调用 其 他 构造 方法 ， 访 问 实例 变 
量 ， 访 问 实例 方法 。 


5) final: 修饰 类 变量 、 实 例 变 量 ， 表 示 只 能 被 赋值 一 次 ， 也 可 以 
修饰 实例 方法 和 局 部 变量 《下 章 会 进一步 介绍 ) 。 


本 节 介 绍 的 Point 类 ， 其 属性 只 有 基本 数据 类 型 ， 下 节 介 绍 类 的 组 
合 ， 以 表达 更 为 复杂 的 概念 。 














32 关 的 组 谷 


程序 是 用 来 解决 现实 问题 的 ， 将 现实 中 的 概念 映射 为 程序 中 的 概 
念 ， 是 初学 编程 过 程 中 的 一 步 跨越 。 本 节 通 过 一 些 例子 来 演示 如 何 将 一 
些 现实 概念 和 问题 通过 类 以 及 类 的 组 合 来 表示 和 人 处理， 涉及 的 概念 包括 
图 形 处 理 、 电 商 、 人 之 间 的 血缘 关系 以 及 计算 机 中 的 文件 和 目录 。 


我 们 先 介 绍 两 个 基础 类 String 和 Date， 它 们 都 是 Java API 中 的 类 ， 分 
别 表 示 文 本 字符 串 和 日 期 。 
3.2.1 String 和 Date 

String 古 Java API 中 的 一 个 类 ， 表 示 多 个 字符 ， 即 一 段 文 本 或 字符 
串 ， 它 内 部 是 一 个 char 的 数组 ， 提 供 了 寿 干 方法 用 于 操作 字符 串 。 

String 可 以 用 一 个 字符 串 常量 初始 化 ， 字 符 串 常量 用 双 引 号 括 起 来 


(注意 与 字符 常量 区 别 ， 字 符 第 量 是 用 单 引号 )。 例 如 ， 如 下 语句 声明 
了 一 个 String 变 量 name， 并 赋值 为 “ 老 马 说 编程 ”。 














String name = " 老 马 说 编程 " ; 





String 类 提供 了 很 多 方法 ， 用 于 操作 字符 串 。 在 Java 中 ， 由 于 String 
用 得 非常 普遍 ，Java 对 它 有 一 些 特殊 的 处 理 ， 本 节 暂 不 介绍 这 些 内 容 ， 
只 是 把 它 当 作 一 个 表示 字符 串 的 类 型 来 看 符 。 


Date 也 是 Java API 中 的 一 个 类 ， 表 示 日 期 和 时 间 ， 它 内 部 是 一 个 
long 类 型 的 值 ， 也 提供 了 知 干 方法 用 于 操作 日 期 和 时 间 。 


用 无 参 的 构造 方法 新 建 一 个 Date 对 象 ， 这 个 对 象 就 表示 当前 时 间 。 





Date now = new Date(); 





日 期 和 时 间 人 处理 是 一 个 比较 大 的 话题 ， 我 们 留待 第 7 半 详 解 ， 本 市 


我 们 只 是 把 它 当 作 表 示 日 期 和 时 间 的 类 型 来 看 待 。 
3.2.2 图形 类 


我 们 先 扩展 一 下 Point 类 ， 在 其 中 增加 一 个 方法 ， 计 算 到 另 一 个 点 的 
距离 ， 代 码 如 下 : 





public double distance(Point p){ 
return Math.sqrt(Math.pow(x-p.getX(), 2)+Math.pow(y-p.getY(), 2)); 
} 





在 类 Point 中 ， 属 性 x、y 都 是 基本 类 型 ， 但 类 的 属性 也 可 以 是 类 。 我 
们 考虑 一 个 表示 线 的 类 ， 它 由 两 个 点 组 成 ， 有 一 个 实例 方法 计算 线 的 长 
度 ， 如 代码 清单 3-2 所 示 。 


代码 清单 3-2 ”表示 线 的 类 Line 





public class Line { 
private Point start; 
private Point end; 
public Line(Point start, Point end){ 
this.start= start,; 
this.end = end; 


} 
public double length(){ 

return start.distance(end); 
} 


} 





Line 由 两 个 Point 组 成 ， 在 创建 Line 时 这 两 个 Point 是 必需 的 ， 所 以 只 
有 一 个 构造 方法 ， 且 需 传 递 这 两 个 点 ，length 方 法 计算 线 的 长 度 ， 它 调 
用 了 Point 计 算 距 离 的 方法 获取 线 的 长 度 。 可 以 看 出 ， 在 设计 线 时 ， 我 们 
考虑 的 层次 是 点 ， 而 不 考虑 点 的 内 部 细节 。 每 个 类 封装 其 内 部 细节 ， 对 
外 提供 高 层次 的 功能 ， 使 其 他 类 在 更 高 层次 上 考虑 和 解决 问题 ， 是 程序 
设计 的 一 种 基本 思维 方式 。 


使 用 这 个 类 的 代码 如 下 所 示 : 





public static void main(String[] args) { 
Point start = new Point(2,3); 


Point end = new Point(3,4); 

Line line = new Line(start, end); 

System.out.println(line.1length( ) )， 
} 








这 也 很 简单 。 我 们 再 说 明 一 下 内 存 布局 ，line 的 两 个 实例 成 员 孝 是 
引用 类 型 ， 引 用 实际 的 point， 整 体内 存 布局 如 图 3-1 所 示 。 
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图 3-1 图形 类 Point 和 Line 对 象 的 内 存 布 局 


start、end、line 三 个 引用 型 变量 分 配 在 栈 中 ， 保 存 的 是 实际 内 容 的 
地 址 ， 实 际 内 容 保 存在 堆 中 ，line 的 两 个 实例 变量 line.start 和 line.end 还 是 
引用 ， 同 样 保存 的 是 实际 内 容 的 地 址 。 


3.2.3 ”用 类 描述 电 商 概念 


接 下 来 ， 我 们 用 类 来 描述 一 下 电 丙 系统 中 的 一 些 基 本 概念 ， 电 商 系 
统 中 最 基本 的 有 产品 、 用 户 和 订单 。 

1) 产品 ;， 有 产品 唯一 id、 名 称 、 描 述 、 图 片 、 价 格 等 属性 。 

2) 用 户 : 有 用 户 名 、 密 码 等 属性 。 


3) 订单 : 有 订单 号 、 下 单 用 户 、 选 购 产 品 列表 及 数量 、 下 单 时 
间 、 收 贷 人 、 收 贷 地 址 、 联 系 电话 、 订 单 状态 等 属性 。 


当然 ， 实 际 情 况 可 能 非常 复杂 ， 这 和 是 一 个 非常 简化 的 描述 


产品 类 Product 如 代码 清单 3-3 所 示 。 


代码 清单 3-3 ”表示 产品 的 类 Product 











public class Product { 
// 唯 一 id 
private String id; 
// 产 品名 称 
private String name; 
// 产 品 图 片 链接 
private String pictureUrJl， 
// 产 品 描述 
private String description; 
// 产 品 价格 
private double price 
































ww 





我 们 省 略 了 类 的 构造 方法 ， 以 及 属性 的 gettersetter 方 法 ， 下 面 大 部 
分 示例 代码 也 都 会 省 略 。 


这 是 用 户 类 User 的 代码 : 





public class User { 
private String name; 
private String password; 





一 个 订单 可 能 会 有 多 个 产品 ， 每 个 产品 可 能 有 不 同 的 数量 ， 我 们 用 
订单 条 目 OrderItem 这 个 类 来 描述 单个 产品 及 选 购 的 数量 ， 如 代码 清单 3- 
4 所 示 。 


代码 清单 3-4 ”表示 订单 条 目的 类 OrderIltem 





public class OrderItem { 
// 购 买 产品 
private Product product; 
// 购 买 数 量 
private int quantity; 
public orderItem(Product product, int quantity) { 
this,product = product,; 
this.quantity = quantity; 








} 
public double computePrice(){ 
return product.getPrice()*quantity; 


OrderItem 引 用 了 产品 类 Product， 我 们 定义 了 一 个 构造 方法 ， 以 及 
计算 该 订单 条 目 价 格 的 方法 。 


订单 类 Order 如 代码 清单 3-5 所 示 。 
代码 清单 3-5 “表示 订单 的 类 Order 





public class Order { 
// 订 单 号 
private String id; 
// 购 买 用 户 
private User user; 
// 购 买 产品 列表 及 数量 
private OrderItem[] items; 
// 下 单 时 间 
private Date createtime; 
// 收 货 人 
private String receiver; 
// 收 货 地 址 
private String address,; 
// 联 系 电话 
private String phone 
// 订 单 状态 
private String status,; 
public double computeTotalPrice(){ 
double totalPrice = 0; 
if(items!=null)t{ 
for(OrderIitem item : Items){ 
totalPrice+=item.computePrice( ); 
} 


return totalPrice' 








Order 类 引用 了 用 户 类 User， 以 及 一 个 订单 条 目的 数组 OrderItem， 
车 完 义 了 二 “| 计算 总 价 四 万 3 ee 更 
合适 的 应 该 是 枚 举 类 型 ， 枚 举 我 们 第 5 章 再 介 


以 上 类 定义 是 非常 简化 的 ， 但 是 大 致 演示 了 将 现实 概念 映射 为 类 以 
及 类 组 合 的 过 程 ， 这 个 过 程 大 概 就 是 ， 想 想 现 实 问题 有 哪些 概念 ， 这 些 
概念 有 哪些 属性 、 哪 些 行为 ， 概 念 之 间 有 什么 关系 ， 然 后 定义 类 、 定 义 
属性 、 定 义 方法 、 定 义 类 之 间 的 关系 。 概 念 的 属性 和 行为 可 能 是 非常 多 
的 ， 但 定义 的 类 只 需要 包括 那些 与 现实 问题 相关 的 就 行 了 。 











3.2.4 用 类 描述 人 之 间 的 血缘 关系 


上 面 介 绍 的 图 形 类 和 电 商 类 只 会 引用 别 的 类 ， 但 一 个 类 定义 中 还 可 
以 引用 它 自 己 ， 比如 我 们 要 描述 人 以 及 人 之 间 的 血缘 关系 。 我 们 用 类 
Person 表 未 一 个 人 ， 它 的 实例 成 员 包 括 其 父亲 、 和 母亲 、 和 孩子 ， 这 些 成 
员 也 都 是 Person 类 型 ， 如 代码 清单 3-6 所 示 。 


代码 清单 3-6 ”表示 人 的 类 Person 











public class Person { 
// 姓 名 





private String name; 

/7/ 父 杀 

private Person father,; 

// 母 亲 

private Person mother,; 

// 孩 子 数组 

private Person[] children; 

public Person(String name) { 
this.name = name; 

} 


} 








这 里 同样 省 略 了 setter/getter 方 法 。 对 初学 者 ， 初 看 起 来 这 是 比较 难 
以 理解 的 ， 有 点 类 似 于 函数 调用 中 的 递归 调用 ， 这 里 面 的 关键 点 是 ， 实 
例 变 量 不 需要 一 开始 就 有 值 。 我 们 来 看 下 如 何 使 用 : 





public static void main(String[] args){ 
Person laoma = new Person(" 老 马 ")， 
Person xiaoma = new Person(" 小 马 ")， 
Be SEE 
laoma.setCchildren(new Person[ |]{xiaoma}); 
System.out.println(xiaoma.getFather().getName()); 
} 





这 段 代 码 先 创建 了 老 马 (laoma) ， 然 后 创建 了 小 马 (xiaoma) ， 
接着 调用 xiaoma 的 set-Father 方 法 和 laoma 的 setChildren 方 法 设置 了 3? A 天 
系 ，Person 类 对 象 的 内 存 布局 如 图 3-2 所 示 。 
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图 3-2 ”Person 类 对 象 的 内 存 布局 
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3.2.5 ”目录 和 文件 


接 下 来 ， 我 们 介绍 两 个 类 MyFile 和 MyFolder， 分 别 表 示 文 件 管理 中 





的 两 个 概念 : 文件 和 文件 夹 。 文 件 和 文件 夹 都 有 名 称 、 创 建 时 间 、 父 文 
件 夹 ， 根 文件 夹 没 有 父 文件 来， 文件 夹 还 有 子 文件 列表 和 子 文件 夹 列 
表 。 文 件 类 MyFile 如 代码 清单 3-7 所 示 。 








代码 清单 3-7 文件 类 MyFile 





public class MyFile { 
// 文 件 名 称 
private String name; 
// 创 建 时 间 
private Date createtime; 
// 文 件 大 小 
private int size,; 
// 上 级 目录 
private MyFolder parent ; 
// 其 他 方法 .… 
public int getSize() { 
return size; 








文件 夹 类 MyFolder 如 代码 清单 3-8 所 示 。 
代码 清单 3-8 文件 夹 类 MyFolder 





public class MyFolder { 
// 文 件 夹 名 称 





private String name; 
// 创 建 时 间 
private Date createtime; 
// 上 级 文件 夹 
private MyFolder parent; 
// 包 含 的 文件 
private MyFile[] files; 
// 包 含 的 子 文件 夹 
private MyFolder[] subFolders,; 
public int totalSize(){ 
int totalSize = 0; 
if(files!=null)t{ 
for(MyFile file : files){ 
totalSize+=file.getSize()， 
} 


} 
if(subFolders!=null){ 
for(MyFolder folder : subFolders)t{ 
totalSsize+=folder.totalSize( ); 
} 














return totalSize; 


} 
// 其 他 方法 …. 





MyFile 和 MyFolder 都 省 略 了 构造 方法 、setttergetter 方 法 ， 以 及 关于 
父子 关系 维护 的 代码 ， 主 要 演示 实例 变量 间 的 组 合 关 系 。 两 个 类 之 间 可 
以 互相 引用 ，MyFile 引 用 了 MyFolder， 而 MyFolder 也 引用 了 MyFile， 这 
是 没有 问题 的 。 因 为 正如 之 前 所 说 ， 这 些 属性 不 需要 一 开始 就 设置 ， 也 
不 是 必须 设置 的 。 男 外 ， 演 示 了 一 个 递归 方法 totalSize“) ， 返 回 当前 
文件 夹 下 所 有 文件 的 大 小 ， 这 是 使 用 递归 函数 的 一 个 很 好 的 场景 。 








3.2.6 “一些 说 明 


类 中 应 该 定义 哪些 变量 和 方法 ， 这 是 与 要 解决 的 问题 密切 相关 的 ， 
本 节 中 并 没有 特别 强调 问题 是 什么 ， 定 义 的 属性 和 方法 主要 用 于 演示 基 
本 概念 ， 实 际 应 用 中 应 该 根据 具体 问题 进行 调整 。 

类 中 实例 变量 的 类 型 可 以 是 当前 定义 的 类 型 ， 两 个 类 之 间 可 以 互相 
引用 ， 这 些 初 听 起 来 可 能 难以 理解 ， 但 现实 世界 就 是 这 样 的， 创建 对 象 
的 时 候 这 些 值 不 需要 一 开始 就 有 ， 也 可 以 没有 ， 所 以 是 没有 问题 的 。 


类 之 间 的 组 合 关 系 在 Java 中 实现 的 都 是 引用 ， 但 在 逻辑 关系 上 ， 有 











两 种 明显 不 同 的 关系 ， 一 种 是 包含 ， 另 一 种 是 单纯 引用 。 比 如 ， 在 订单 
类 Order 中 ，Order 与 User 的 关系 就 是 单纯 引用 ，User 是 独立 存在 的 ; 而 
Order 与 OrderItem 的 关系 就 是 包含 ，Orderltem 总 是 从 属于 某 一 个 Order。 


277 小 全 


对 初学 编程 的 人 来 说 ， 不 清楚 如 何 用 程序 概念 表示 现实 问题 ， 本 忆 
通过 一 些 简 化 的 例子 来 解释 如 何 将 现实 中 的 概念 映射 为 程序 中 的 类 。 


分 解 现实 问题 中 涉及 的 概念 以 及 概念 间 的 关系 ， 将 概念 表示 为 多 个 
类 ， 通 过 类 之 间 的 组 合 来 表达 更 为 复杂 的 概念 以 及 概念 间 的 关系 ， 是 计 
算 机 程序 的 一 种 基本 思维 方式 。 

正 所 谓 建生 一 ， 一生 二 ， 二 坐 三 > 三 全力 物 如 来 将 二 二 市 表示 


和 运算 看 作 一 ， 将 基本 数据 类 型 看 作 二 ， 基 本 数据 类 型 形成 的 类 看 作 
三 ， 那 么 ， 类 的 组 合 以 及 下 章 介 绍 的 继承 则 使 得 三 生 万 物 。 














3.3 ”代码 的 组 织 机 制 


使 用 任何 语言 进行 编程 都 有 一 个 类 似 的 问题 ， 那 就 是 如 何 组 织 代 
人 码 。 具 体 来 说 ， 如 何 避 免 命名 冲突 ? 如 何 合理 组 织 各 种 源 文件 ? 如 何 使 
用 第 三 方 库 ? 各 种 代码 和 依赖 库 如 何 编 译 链接 为 一 个 完整 的 程序 ? 本 节 
就 来 讨论 Java 中 的 解决 机 制 ， 具体 包括 包 、jar 包 、 程 序 的 编译 与 链接 


3.3.1 包 的 概念 





使 用 任何 语言 进行 编程 都 有 一 个 相同 的 问题 ， 就 是 命名 冲突 。 程 
序 一 般 不 全 是 一 个 人 写 的 ， 会 调用 系统 提供 的 代码 、 第 三 方 库 中 的 代 
码 、 项 目 中 其 他 人 写 的 代码 等 ， 不 同 的 人 就 不 同 的 目的 可 能 定义 同样 的 
类 名 /接口 名 ，Java 中 解决 这 个 问题 的 主要 方法 束 是 包 。 


即使 代码 都 是 一 个 人 写 的 ， 将 多 个 关系 不 太 大 的 类 和 接口 都 放 在 一 
起 ， 也 不 便于 理解 和 维护 ，Java 中 组 织 类 和 接口 的 方式 也 是 包 。 


包 古 一 个 比较 容易 理解 的 概念 ， 类 似 于 计算 机 中 的 文件 来 ， 正 如 我 
们 在 计算 机 中 管理 文件 ， 文 件 放 在 文件 夹 中 一 样 ， 类 和 接口 放 在 包 中 ， 
为 便于 组 织 ， 文 件 夹 一 般 是 一 个 层次 结构 ， 包 也 类 似 。 


包 有 包 名 ， 这 个 名 称 以 点 号 〈.) 分 隔 表示 层次 结构 。 比 如 ， 我 们 
之 前 常用 的 String 类 就 位 于 包 java.lang 下 ， 其 中 java 是 上 层 包 名 ，lang 是 
下 层 包 名 。 禹 完整 包 名 的 类 名 称 为 其 完全 限定 名 ， 比如 String 类 的 完全 
限定 名 为 java.lang.String。Java API 中 所 有 的 类 和 接口 都 位 于 包 Java 或 
javax 下 ，Java 是 标准 包 ，javax 是 扩展 包 。 


本 接 下 来 ， 我 们 讨论 包 的 细节 ， 包 括 包 的 声明 、 使 用 和 包 范 围 可 见 





























1. 声 明 类 所 在 的 包 


我 们 之 前 定义 类 的 时 候 没 有 定义 其 所 在 的 包 ， 默 认 情 况 下 ， 类 位 于 
默认 包 下 ， 使 用 默认 包 是 不 建议 的 ， 我 们 使 用 默认 包 只 是 简单 起 见 。 





” ”定义 类 的 时 候 ， 应 该 先 使 用 关键 字 package 声 明 其 包 名 ， 如 下 所 
修 \: 





package shuo.1laoma; 
public class Hello { 
// 类 的 定义 


以 上 声明 类 Hello 的 包 名 为 shuo.laoma， 包 声明 语句 应 该 位 于 源 代码 
的 最 前 面 ， 前 面 不 能 有 注释 外 的 其 他 语句 。 


包 名 和 文件 目录 结构 必须 匹配 ， 如 果 源 文件 的 根 目录 为 E: \srcN， 
则 上 面 的 Hello 类 对 应 的 文件 Hello.java， 其 全 路 径 就 应 该 是 E: 
\src\shuo\laoma\Hello.java。 如 果 不 匹 配 ，Java 会 提示 编译 错误 。 


为 避免 命 名 冲突 ，Java 中 命名 包 名 的 一 个 惯例 是 使 用 域名 作为 前 
级 ， 因 为 域名 是 唯一 的 ， 一 般 按 照 域名 的 反 序 来 定义 包 名 ， 比 如 ， 域 名 
是 apache.org， 包 名 就 以 org.apache 开 头 。 


没有 域名 的 也 没关系 ， 使 用 一 个 其 他 代码 不 太 会 用 的 包 名 即 可 ， 比 
如 本 节 使 用 的 shuo.laoma。 如 果 代 码 需 要 公开 给 其 他 人 用 ， 最 好 有 一 个 
域名 以 确保 唯一 性 ， 如 果 只 是 内 部 使 用 ， 则 确保 内 部 没有 其 他 代码 使 用 
该 包 名 即 可 。 


除了 避免 命名 冲突 ， 包 也 是 一 种 方便 组 织 代码 的 机 制 。 一 般 而 言 ， 
同一 个 项 目下 的 所 有 代码 部 有 一 个 相同 的 包 前 级 ， 这 个 前 级 是 唯一 的 ， 
不 会 与 其 他 代码 重 名 ， 在 项 目 内 部 ， 根 据 不 同 目的 再 细 分 为 子 包 ， 子 包 
0 形成 层次 结构 ， 内 部 实现 一 般 位 于 比较 拘 层 


包 可 以 方便 模块 化 开发 ， 不 同 功能 可 以 位 于 不 同 包 内 ， 不 同 开 及 人 
员 负 责 不 同 的 包 。 包 也 可 以 方便 封装 ， 供 外 部 使 用 的 类 可 以 放 在 包 的 上 
层 ， 而 内 部 的 实现 细节 则 可 以 放 在 比较 确 层 的 子 包 内 。 























同一 个 包 下 的 类 之 间 互 相 引用 是 不 需要 包 名 的 ， 可 以 直接 使 用 。 但 
如 果 类 不 在 同一 个 包 内 ， 则 必须 要 知道 其 所 在 的 包 。 使 用 有 两 种 方式 : 





一 种 是 通过 类 的 完全 限定 名 ; 另外 一 种 是 将 用 到 的 类 引入 当前 类 。 只 有 
一 个 例外 ，java.lang 包 下 的 类 可 以 直接 使 用 ， 不 需要 引入 ， 也 不 需要 使 
用 完全 限定 名 ， 比 如 String 类 、System 类 ， 其 他 包 内 的 类 则 不 行 。 


汪 看 个 例子 ， 使 用 Arrays 类 中 的 sort 方 法 ， 通 过 完全 限定 名 可 以 这 样 
用 : 





int[] arr = new int[]{1,4,2,3}; 
java.util.Arrays.sort(arr); 
System,out.println(java,util,.Arrays.toString(arr))， 





_ 显然， 这 样 比较 烦 天 ， 男 外 一 种 束 是 将 该 类 引入 当前 类 。 引 入 的 关 
键 字 是 import，import 需 要 放 在 package 定 义 之 后 ， 类 定义 之 前 ， 如 下 所 
MA/ 八 : 





package shuo.1laoma; 
import java.util.Arrays; 
public class Hello { 
public static void main(String[] args) { 
int[] arr = new int[]{1,4,2,3}; 
Arrays.sort(arr); 
System.out.println(Arrays.toSstring(arr)); 
} 
} 





做 import 操 作 时 ， 可 以 一 次 将 某 个 包 下 的 所 有 类 引入 ， 语 法 是 使 
用 .*， 比 如 ， 将 java.util 包 下 的 所 有 类 引入 ， 语 法 是 : import java.util.*。 
需要 注意 的 是 ， 这 个 引入 不 能 递归 ， 它 只 会 引入 java.util 包 下 的 直接 
类 ， 而 不 会 引入 java.util 下 网 套 包 内 的 类 ， 比 如 ， 不 会 引入 包 java.util.zip 
下 面 的 类 。 试 图 散 套 引入 的 形式 也 是 无 效 的 ， 如 import java.util.*.*。 


在 一 个 类 内 ， 对 其 他 类 的 引用 必须 是 唯一 确定 的 ， 不 能 有 重 名 的 
类 ， 如 果 有 ， 则 通过 import 只 能 引入 其 中 的 一 个 类 ， 其 他 同名 的 类 则 必 
须要 使 用 完全 限定 名 。 

引入 类 是 一 个 比较 烦琐 的 工作 ， 不 过 ， 大 多 数 Java 开 发 环境 都 提供 
工具 自动 做 这 件 事 。 比 如 ， 在 Eclipse 中 ， 通 过 执行 Source > Organize 
Imports 命 令 或 按 对 应 的 快捷 键 Ctrl+Shift+O 就 可 以 自动 管理 引用 的 类 。 


有 一 种 特殊 类 型 的 导入 ， 称 为 静态 导入 ， 它 有 一 个 static 关 键 字 ， 可 


以 直接 导入 类 的 公开 静态 方法 和 成 员 。 看 个 例子 : 





import static java.lang.System.out; // 导 入 静态 变量 out 
public class Hello { 
public static void main(String[] args) { 
int[] arr = new int[]{1,4,2,3}; 
sort(arr); // 可 以 直接 使 用 Arrays 中 的 sort 方 法 
out .println(Arrays.toString(arr)); // 可 以 直接 使 用 out 变 量 






































} 
} 





静态 导入 不 应 过 度 使 用 ， 和 否则 难以 区 分 访问 的 是 哪个 类 的 代码 。 
3. 包 范围 可 见 性 


前 面 章 市 我 们 介绍 过 ， 对 于 类 、 变 量 和 方法 ， 都 可 以 有 一 个 可 见 性 
修饰 符 public/private， 我 们 还 提 到 ， 可 以 不 写 修饰 符 。 如 果 什 么 修饰 符 
都 不 号 ， 它 的 可 见 性 范围 就 是 同一 个 包 内 ， 同 一 个 包 内 的 其 他 类 可 以 访 
问 ， 而 其 他 包 内 的 类 则 不 可 以 访问 。 


需要 说 明 的 是 ， 同 一 个 包 指 的 是 同一 个 直接 包 ， 子 包 下 的 类 并 不 能 
访问 。 比 如 ， 类 shuo.laoma.Hello 和 shuo.laoma.inner.Test， 其 所 在 的 包 
shuo.laoma 和 shuo.laoma.inner 是 两 个 完全 独立 的 包 ， 并 没有 逻辑 上 的 联 
系 ，Hello 类 和 Test 类 不 能 互相 访问 对 方 的 包 可 见 性 方法 和 属性 。 


除了 public 和 private 修 饰 符 ， 还 有 一 个 与 继承 有 关 的 修饰 符 
protected。 关 于 protected 的 细节 我 们 下 章 介 绍 ， 这 里 需要 说 明 的 是 ， 
protected 可 见 性 包括 包 可 见 性 ， 也 就 是 说 ， 声 明 为 protected 不 仅 表明 子 
类 可 以 访问 ， 还 表明 同一 个 包 内 的 其 他 类 可 以 访问 ， 即 使 这 些 类 不 是 子 
类 也 可 以 。 


总 结 来 说 ， 可 见 性 范围 从 小 到 大 是 : private< 默 认 〈 包 ) 


<protected<public 。 





3.3.2 jar 包 


为 方便 使 用 第 三 方 代码 ， 也 为 了 方便 我 们 写 的 代码 给 其 他 人 使 用 ， 
各 种 程序 语言 大 多 有 打包 的 概念 ， 打 包 的 一 般 不 是 源 代码 ， 而 是 编译 后 
的 代码 。 打 包 将 多 个 编译 后 的 文件 打包 为 一 个 文件 ， 方 便 其 他 程序 调 














用 。 
在 Java 中 ， 编 译 后 的 一 个 或 多 个 包 的 Java class 文 件 可 以 打包 为 一 个 
ee 
可 以 使 用 如 下 方式 打包 ， 首 先 到 编译 后 的 java class 文 件 根 目录 ， 然 
后 运行 如 下 命令 : 


jar -cvf < 包 名 >.jar < 最 上 层 包 名 > 


比如 ， 对 前 面 介 绍 的 类 打包 ， 如 果 Hello.class 位 于 E: 
\bin\shuo\laoma\Hello.class， 则 可 以 到 目录 E: \bin 下 ， 然 后 运行 : 





jar -cvf hello.jar shuo 


hello.jar 就 是 jar 包 ，jar 包 其 实 束 是 一 个 压缩 文件 ， 可 以 使 用 解压 缩 
工具 打开 。 


Java 类 库 、 第 三 方 类 库 都 是 以 jar 包 形式 提供 的 。 如 何 使 用 jar 包 呢 ? 
将 其 加 入 类 路 径 《〈classpath) 中 即 可 。 类 路 径 是 什么 呢 ? 我 们 下 面 来 
看 。 





3.3.3 ”程序 的 编译 与 链接 





从 Java 源 代码 到 运行 的 程序 ， 有 编译 和 链接 两 个 步骤 。 编 译 是 将 源 
代码 文件 变 成 扩展 名 是 .class 的 一 种 字 节 人 码 ， 这 个 工作 一 般 是 由 javac 命 
令 完 成 的 。 链 接 是 在 运行 时 动态 执行 的 ，.class 文 件 不 能 直接 运行 ， 运 行 
的 是 Java 虚 拟 机 ， 虚 拟 机 听 起 来 比较 抽象 ， 执 行 的 就 是 Java 命 令 ， 这 个 
命令 解析 .class 文 件 ， 转 换 为 机 器 能 识别 的 二 进 制 代码 ， 然 后 运行 。 所 谓 
链接 就 是 根据 引用 到 的 类 加 载 相 应 的 字 节 码 并 执行 。 


Java 编 译 和 运行 时 ， 都 需要 以 参数 指定 一 个 classpath， 即 类 路 径 。 
类 路 径 可 以 有 多 个 ， 对 于 直接 的 class 文 件 ， 路 径 是 class 文 件 的 根 目 录 ; 
对 于 jar 包 ， 路 径 是 jar 包 的 完整 名 称 〈 包 括 路 径 和 jar 包 名 ) 。 在 Windows 











系统 中 ， 多 个 路 径 用 分 号 “;， "分隔 ; 在 其 他 系统 中 ， 以 冒号 <; ”分 隔 。 


在 Java 源 代码 编译 时 ，Java 编 译 器 会 确定 引用 的 每 个 类 的 完全 限定 
名 ， 确 定 的 方式 是 根据 import 语 句 和 classpath。 如 果 导 入 的 是 完全 限定 
类 名 ， 则 可 以 直接 比较 并 确定 。 如 果 是 模糊 导入 (import 融 .*) ， 则 根 
据 classpath 找 对 应 父 包 ， 再 在 父 包 下 寻找 是 否 有 对 应 的 类 。 如 果 多 个 模 
糊 导 入 的 包 下 都 有 同样 的 类 名 ， 则 Java 会 提示 编译 错误 ， 此 时 应 该 明确 
指定 导入 哪个 类 。 


Java 运 行 时 ， 会 根据 类 的 完全 限定 名 寻找 并 加 载 类 ， 寻 找 的 方式 束 
是 在 类 路 径 中 寻找 ， 如 宁 是 class 文 件 的 根 目 录 ， 则 直接 查看 是 否 有 对 应 
的 子 目录 及 文件 ， 如 果 是 jar 文 件 ， 则 首先 在 内 存 中 解压 文件 ， 然 后 再 查 
看 是 否 有 对 应 的 类 。 


总 结 来 说 ，import 是 编译 时 概念 ， 用 于 确定 完全 限定 名 ， 在 运行 
时 ， 只 根据 完全 限定 名 寻找 并 加 载 类 ， 编译 和 运行 时 都 依赖 类 路 径 ， 
类 路 径 中 的 jar 文 件 会 被 解压 缩 用 于 寻找 和 加 载 类 。 





























334 小 结 


本 市 介绍 了 Java 中 代码 组 织 的 机 制 、 包 和 jar 包 ， 以 及 程序 的 编译 和 
链接 。 将 类 和 接口 放 在 合适 的 具有 层次 结构 的 包 内 ， 避 免 命名 冲突 ， 代 
码 可 以 更 为 清晰 ， 便 于 实现 封装 和 模块 化 开发 ;通过 jar 包 使 用 第 三 方 代 
伍 /; 人 这 些 都 是 解决 复杂 问题 所 


在 Java 9 中 ， 清 晰 地 引入 了 模块 的 概念 ，JDK 和 JRE 都 按 模块 化 进 
行 了 重 构 ， 传 统 的 组 织 机 制 依然 是 支持 的 ， 但 新 的 应 用 可 以 使 用 模块 。 
一 个 应 用 可 由 多 个 模块 组 成 ， 一 个 模块 可 由 多 个 包 组 成 。 模 块 之 间 可 以 
有 一 定 的 依赖 关系 ， 一 个 模块 可 以 导出 包 给 其 他 模块 用 ， 可 以 提供 服务 
给 其 他 模块 用 ， 也 可 以 使 用 其 他 模块 提供 的 包 ， 调 用 其 他 模块 提供 的 服 
务 。 对 于 复杂 的 应 用 ， 模 块 化 有 很 多 好 人 处， 比如 更 强 的 封 狼 、 更 为 可 靠 
的 配置 、 更 为 松散 的 耦合 、 更 动态 灵活 等 。 模 块 是 一 个 很 大 的 主题 ， 限 
于 篇 幅 ， 我 们 就 不 详细 介绍 了 。 


人 至此， 关于 类 的 基础 知识 就 介绍 完了 。 类 之 间 除 了 组 合 关系 ， 还 有 
一 种 非常 重要 的 关系 ， 那 就 是 继承 ， 我 们 下 章 来 探讨 。 








第 4 革 ”类 的 继承 


上 一 章 ， 我 们 谈 到 了 如 何 将 现实 中 的 概念 映射 为 程序 中 的 概念 ， 我 
们 谈 了 类 以 及 类 之 间 的 组 合 ， 现 实 中 的 概念 间 还 有 一 种 非常 重要 的 关 
系 ， 束 是 分 类 。 分 类 有 个 根 ， 然 后 向 下 不 断 细 化 ， 形 成 一 个 层次 分 类 
体系 ， 这 种 例子 是 非常 多 的 。 


1) 在 自然 世界 中 ， 生 物 有 动物 和 植物 ， 动 物 有 不 同 的 科目 ， 食 肉 
动物 、 食 章 动 物 、 杂 食 动物 等 ， 食 肉 动物 有 狼 、 豹 、 席 等 ， 这 些 又 细 分 
为 不 同 的 种 类 。 


2) 打开 电 商 网 站 ， 在 显著 位 置 一 般 都 有 分 类 列表 ， 比 如 家 用 电 
器 、 服 装 ， 服 装 有 女装 、 男 装 ， 男 装 有 衬衫、 牛仔 裤 等 。 


计算 机 程序 经 常 使 用 类 之 间 的 继承 关系 来 表示 对 象 之 间 的 分 类 关 
系 。 在 继承 关系 中 ， 有 父 类 和 子 类 ， 比 如 动物 类 Animal 和 狗 类 Dog， 
Animal 是 父 类 ，Dog 是 子 类 。 父 类 也 叫 基 类 ， 子 类 也 叫 派生 类 。 父 
类 、 子 类 是 相对 的 ， 一 个 类 B 可 能 是 类 A 的 子 类 ， 但 又 是 类 C 的 父 类 。 


之 所 以 叫 继承 ， 是 因为 子 类 继承 了 父 类 的 属性 和 行为 ， 父 类 有 的 属 
性 和 行为 子 类 都 有 。 但 子 类 可 以 增加 子 类 特有 的 属性 和 行为 ， 茶 些 父 类 
有 的 行为 ， 子 类 的 实现 方式 可 能 与 父 类 也 不 完全 一 样 。 


使 用 继承 一 方面 可 以 复 用 代码 ， 公 共 的 属性 和 行为 可 以 放 到 父 类 
中 ， 而 子 类 只 需要 关注 子 类 特有 的 就 可 以 了 ; 男 一 方面 ， 不 同 子 类 的 对 
象 可 以 更 为 方便 地 被 统一 处 理 。 


本 章 详 细 介 绍 继承 。 我 们 先 介 绍 继承 的 基本 概念 ， 然 后 详 述 继承 的 
一 些 细节 ， 理 解 了 继承 的 用 法 之 后 ， 我 们 探讨 继承 实现 的 基本 原理 ， 最 
后 讨论 继承 的 注意 事项 ， 解 释 为 什么 说 继承 是 把 双 丸 证 ， 以 及 如 何 正 确 
地 使 用 继承 。 





























4.1 基本 概念 


本 节 介 绍 Java 中 继承 的 基本 概念 ， 在 Java 中 ， 所 有 类 都 有 一 个 父 类 
Object， 我 们 先 来 看 这 个 类 ， 人 然后 主要 通过 图 形 处 理 中 的 一 些 简单 例子 
来 介绍 继承 的 基本 概念 。 


4.1.1 根 父 关 Object 


在 Java 中 ， 即 使 没有 声明 父 类 ， 也 有 一 个 隐 含 的 父 类 ， 这 个 父 类 叫 
Object。Object 没 有 定义 属性 ， 但 定义 了 一 些 方法 ， 如 图 4-1 所 示 。 


equals(Object obj) : boolean - Object 
getClass() : Class<?> - Object 
hashCode() : int - Object 

notify() : void - Object 

notifyAll() : void - Object 


CeNidt IN Eee 二 aa 

®@ wait() : void - Object 

® wait(long timeout) : void - Object 

© wait(long timeout, int nanos) : void - Object 





图 4-1 ”类 Object 中 的 方法 
本 节 我 们 会 介绍 toString 〈) 方法 ， 其 他 方法 我 们 会 在 后 续 章 节 中 
逐步 介绍 。toString〈) 方法 的 目的 是 返回 一 个 对 象 的 文本 摘 述 ， 这 个 
方法 可 以 直接 被 所 有 类 使 用 。 
比如 ， 对 于 我 们 上 一 章 介 绍 的 Point 类 ， 可 以 这 样 使 用 toString 方 
法 : 











Point p = new Point(2,3); 
System,.out.println(p.toSstring()); 





输出 类 似 这 样 : 





Point@76f9aa66 











这 是 什么 意思 呢 ? @ 之 前 是 类 名 ，@ 之 后 的 内 容 是 什么 呢 ? 我 们 来 
看 下 toString 〈) 方法 的 代码 : 





public String toString() { 
return getcClass().getName() + "@" + Integer.toHexString(hashCode()); 
} 





getClass〈) .getName〈) 返回 当前 对 象 的 类 名 ，hashCode 〈) 返回 
一 个 对 象 的 哈 希 值 ， 哈 和 希 我 们 会 在 后 续 章 节 进 一 步 介绍 ， 这 里 可 以 理解 
为 是 一 个 整数 ， 这 个 整数 默认 情况 下 ， 通 常 是 对 象 的 内 存 地 址 值 ， 
Integer.toHexString (hashCode() ) 返回 这 个 哈 希 值 的 十 六 进 制 表示 。 


为 什么 要 这 么 写 呢 ? 写 类 名 是 可 以 理解 的 ， 表 示 对 象 的 类 型 ， 而 写 
哈 硕 值 则 是 不 得 已 的 ， 因 为 Object 类 并 不 知道 具体 对 象 的 属性 ， 不 知道 
怎么 用 文本 描述 ， 但 又 需要 区 分 不 同 对 象 ， 只 能 是 写 一 个 哈 希 值 。 


但 子 类 是 知道 自己 的 属性 的 ， 子 类 可 以 重 写 父 类 的 方法 ， 以 反映 
目 己 的 不 同 实现 。 所 请 重 写 ， 就 是 定义 和 父 类 一 样 的 方法 ， 并 重新 实 
现 。 























4.1.2 方法 重 写 





上 一 章 ， 我 们 介绍 了 一 些 图 形 处 理 类 ， 其 中 有 Point 类 ， 这 次 我 们 重 
写 其 toString() 方法 ， 如 代码 清单 4-1 所 示 。 


代码 清单 4-1 Point 类 : 重 写 toString () 方法 





public class Point { 
private int x; 
private int y; 


public Point(int x, int y) { 
this.x = x; 
this.y = y; 


} 
public double distance(Point point){ 
return Math.sqrt(Math.pow(this.x-point.getXx(),2) 
+Math.pow(this.y-point.getY(), 2)); 


} 
public int getX() { 
return x; 


} 
public int getY() { 
return y; 


Q@Override 
public Strang i 全 
return "("+x+","+y+")",; 





toString 是 方法 前 面 有 一 个 @Override， 这 表示 toString 〈) 这 个 方 
法 是 重 写 的 父 类 的 方法 ， 重 写 
后 ， 将 调用 子 类 的 实现 。 比 如 ， 如 下 代码 的 输出 就 变 成 了 〈2，3) 。 








Point p = new Point(2,3); 
System.out.println(p.tostring()); 





4.1.3 图 形 类 继承 体系 
接 下 来 ， 我 们 以 一 些 图 形 处 理 中 的 例子 来 进一步 解释 。 先 来 看 一 些 
图 形 的 例子 ， 如 图 4-2 所 示 。 


这 都 是 一 些 基本 的 图 形 ， 图 形 有 线 、 正 方形 、 三 角形 、 圆 形 等 ， 图 
ST 接 下 来 ， 我 们 定义 以 下 类 来 说 明 关 于 继承 的 一 些 概 
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图 4-2 一 些 图 形 的 例子 
父 类 Shape， 表 示 图 形 。 
类 Circle， 表 示 圆 。 
-类 Line， 表 示 直 线 。 
类 ArrowLine， 表 示 带 箭头 的 直线 。 
1. 图 形 


所 有 图 形 〈Shape) 都 有 一 个 表示 颜色 的 属性 ， 有 一 个 表示 绘制 的 
方法 ， 如 代码 清单 4-2 所 示 。 


代码 清单 4-2 ”类 Shape 









public class Shape { 


private static final String DEFAULT_COLOR = "black"; 
private String color; 
public Shape() { 

this(DEFAULT_COLOR); 


} 
public Shape(String color) { 
this.color = color; 


public String getColor() { 
return color; 


public void setColor(String color) { 
this.color = color; 


} 

public void draw(){ 
System,.out.println("draw shape"); 

} 





以 上 代码 非常 简单 ， 实 例 变 量 color 表 示 颜 色 ，draw 方 法 表示 绘制 ， 
我 们 没有 写实 际 的 绘制 代码 ， 主 要 是 演示 继承 关系 。 


2. 圆 

(CCircle) 继承 自 Shape， 但 包括 了 额外 的 属性 : 中 心 点 和 半径 ， 
以 及 额外 的 方法 area， 用 于 计算 面积 ， 另 外 ， 重 写 了 draw 方 法 ， 如 代码 
清单 4-3 所 示 。 


代码 清单 4-3 ”类 Circle 








public class Circle extends Shape { 

// 中 心 点 

private Point center; 

/7 半径 

private double r; 

public Circle(Point center, double r) { 
this.center = center; 
this.r = r; 





Q@Override 
public void draw() { 
System,.out.println("draw circle at " +center.toString()+" with r "+r 
+", UsSing color : "+getColor()); 


} 
public double area(){ 
return Math.PI*r*r; 





说 明 : 


1) Java 使 用 extends 关 键 字 表 示 继 承 关 系 ， 一 个 类 最 多 只 能 有 一 个 


父 类 ; 


2) 子 类 不 能 直接 访问 父 类 的 私有 属性 和 方法 。 比 如 ， 在 Circle 中 ， 
不 能 直接 访问 Shape 的 私有 实例 变量 color; 


3) 除了 私有 的 外 ， 子 类 继承 了 父 类 的 其 他 属性 和 方法 。 比 如 ， 在 
Circle 的 draw 方 法 中 ， 可 以 直接 调用 getColor 〈) 方法 。 


使 用 它 的 代码 如 下 : 





public static void main(String[] args) { 
Point center = new Point(2,3); 
// 创 建 圆 ， 赋 值 给 circle 
Circle circle = new Circle(center,2); 
// 调 用 draw 方 法 ， 会 执行 Circle 的 draw 方 法 
circle.draw( ); 
// 输 出 圆 面积 
System.out.println(circle.areal( )); 









































程序 的 输出 为 : 





draw circle at (2,3) with r 2.0, using color : black 
12.566370614359172 





这 里 比较 奇怪 的 是 ，color 是 什么 时 候 赋值 的 ? 在 new 的 过 程 中 ， 父 
类 的 构造 方法 也 会 执行 ， 且 会 优先 于 子 类 执行 。 在 这 个 例子 中 ， 父 类 
Shape 的 默认 构造 方法 会 在 子 类 Circle 的 构造 方法 之 前 执行 。 关 于 new 过 
程 的 细节 ， 我 们 会 在 4.3 节 进一步 介绍 。 

3. 直 线 


线 (Line) 继承 自 Shape， 但 有 两 个 点 ， 以 及 一 个 获取 长 度 的 方 
法 ， 并 重 写 了 draw 方 法 ， 如 代码 清单 4-4 所 示 。 


代码 清单 4-4 类 Line 














public class Line extends Shape { 
private Point start,; 
private Point end; 


public Line(Point start, Point end，String color) { 
super (color); 
this.start = start,; 
this.end = end; 


} 
public double length(){ 
return start.distance(end); 


} 
public Point getStart() { 
return start; 


} 
public Point getEnd() { 
return end; 


Q@Override 
public void draw() { 
System.out.printin("draw line from " 
+ start.toString()+" to "+end.toString() 
+ "using color "+super.getColor()); 





这 里 我 们 要 说 明 的 是 super 这 个 关键 字 ，super 用 于 指 代 父 类 ， 可 用 
于 调用 父 类 构造 方法 ， 访 问 父 类 方法 和 变量 。 


1) 在 Line 构 造 方法 中 ，super (color) 表示 调用 父 类 的 带 color 参 数 
的 构造 方法 。 调 用 父 类 构造 方法 时 ，super 必 须 放 在 第 一 行 。 





2) 在 draw 方 法 中 ，super.getColor() 表示 调用 父 类 的 getColor 方 
法 ， 当 然 不 写 super. 也 是 可 以 的 ， 因 为 这 个 方法 子 类 没有 同名 的 ， 没 有 
歧义 ， 当 有 歧义 的 时 候 ， 通 过 super. 可 以 明确 表示 调用 父 类 的 方法 。 


3) super 同 样 可 以 引用 父 类 非 私有 的 变量 。 

可 以 看 出 ，super 的 使 用 与 this 有 点 像 ， 但 super 和 this 是 不 同 的 ，this 
引用 一 个 对 象 ， 是 实 实在 在 存在 的 ， 可 以 作为 函数 参数 ， 可 以 作为 返回 
值 ， 但 super 只 是 一 个 关键 字 ， 不 能 作为 参数 和 返回 值 ， 它 只 是 用 于 告诉 
编译 器 访问 父 类 的 相关 变量 和 方法 。 

4. 带 箭头 直线 


市 箭头 直线 (ArrowLine) 继承 自 Line， 但 多 了 两 个 属性 ， 分 别 表 
示 两 端 是 否 有 箭头 ， 也 重 写 了 draw 方 法 ， 如 代码 清单 4-5 所 示 。 














代码 清单 4-5 ”类 ArrowLine 





public class ArrowLine extends Line { 

private boolean startArrow; 

private boolean endArrow; 

public ArrowLine(Point start, Point end, String color, 

boolean startArrow, boolean endArrow) { 

super(start, end, color); 
this.startArrow = startArrow; 
this.endArrow = endArrow; 


Q@Override 
public void draw() { 
super .draw( )，; 
if(startArrow)t{ 
System.out.printin("draw start arrow"); 


} 
if(endArrow){ 

System.out.printiln("draw end arrow"); 
} 


} 
} 





ArrowLine 继 承 自 Line， 而 Line 继 承 自 Shape，ArrowLine 的 对 象 也 有 
Shape 的 属性 和 方法 。 


注意 draw() 方法 的 第 一 行 ，super.draw〈) 表示 调用 父 类 的 
draw() 方法 ， 这 时 候 不 带 super. 是 不 行 的 ， 因 为 当前 的 方法 也 叫 
draw () 。 


需要 说 明 的 是 ， 这 里 ArrowLine 继 承 了 Line， 也 可 以 直接 在 类 Line 里 
加 上 属性 ， 而 不 需要 单独 设计 一 个 类 ArrowLine， 这 里 主要 是 演示 继承 
的 层级 性 。 


5. 图 形 管 理 器 

使 用 继承 的 一 个 好 处 是 可 以 统一 处 理 不 同 子 类 型 的 对 象 。 比 如 ， 我 
们 来 看 一 个 图 形 管理 者 类 ， 它 负责 管理 画板 上 的 所 有 图 形 对 象 并 负责 绘 
制 ， 在 绘制 代码 中 ， 只 需要 将 每 个 对 象 当 作 Shape 并 调用 draw 方 法 就 可 
以 了 ， 系 统 会 自动 执行 子 类 的 draw 方 法 。 如 代码 清单 4-6 所 示 。 


代码 清单 4-6 图 形 管理 器 类 ShapeManager 











public class ShapeManager { 
private static final int MAX_NUM = 100; 
private Shape[] shapes = new Shape[MAX_NUM]; 
private int shapeNum = 0; 
public void addShape(Shape Shape){ 
if(shapeNum<MAX_NUM) 


shapes[shapeNum++] = Shape 


} 
public void draw(){ 
for(int i=0; i<shapeNum; i++){ 
shapes[i].draw( ); 








ShapeManager 使 用 一 个 数组 保存 所 有 的 shape， 在 draw 方 法 中 调用 
每 个 shape 的 draw 方 法 。ShapeManager 并 不 知道 每 个 shape 具 体 的 类 型 ， 
也 不 关心 ， 但 可 以 调用 到 子 类 的 draw 方 法 。 


我 们 来 看 下 使 用 ShapeManager 的 一 个 例子 : 





public static void main(String[] args) { 
ShapeManager manager = new ShapeManager(); 
manager .addShape(new Circle(new Point(4,4),3)); 
manager .addShape(new Line(new Point(2,3), new Point(3,4),"green")); 
manager .addShape(new ArrowLine(new Point(1,2), 
new Point(5,5),"black",false,true)); 
manager .draw( ); 








新 建 了 三 个 shape， 分 别 是 一 个 贺 、 直 线 和 市 第 头 的 线 ， 然 后 加 到 
了 shape manager 中 ， 然 后 调用 manager 的 draw 方 法 。 


需要 说 明 的 是 ， 在 addShape 方 法 中 ， 参 数 Shape shape， 声 明 的 类 型 
是 Shape， 而 实际 的 类 型 则 分 别 是 Circle、Line 和 ArrowLine。 子 类 对 象 赋 
值 给 父 类 引用 变量 ， 这 叫 同 上 转型 ， 转 型 就 是 转换 类 型 ， 向 上 转型 就 
是 转换 为 父 类 类 型 。 


变量 shape 可 以 引用 任何 Shape 子 类 类 型 的 对 象 ， 这 叫 多 态 ， 即 一 种 
类 型 的 变量 ， 可 引用 多 种 实际 类 型 对 象 。 这 样 ， 对 于 变量 shape， 它 就 
有 两 个 类 型 : 类 型 Shape， 我 们 称 之 为 shape 的 静态 类 型 ; 类 型 
Circle/Line/ArrowLine， 我 们 称 之 为 shape 的 动态 类 型 。 在 ShapeManager 
的 draw 方 法 中 ，shapes[i.draw〈) 调用 的 是 其 对 应 动态 类 型 的 draw 方 
法 ， 这 称 之 为 方法 的 动态 绑 定 。 


为 什么 要 有 多 态 和 动态 绑 定 呢 ? 创建 对 象 的 代码 〈ShapeManager 以 
外 的 代码 )》 和 操作 对 象 的 代码 〈ShapeManager 本 身 的 代码 ) ， 经 常 不 在 
一 起 ， 操 作对 象 的 代码 往往 只 知道 对 象 是 某 种 父 类 型 ， 也 往往 只 需要 知 




















道 它 是 茶 种 父 类 型 就 可 以 了 。 


可 以 将 ， 多 态 和 动态 绑 定 是 计算 机 程序 的 一 种 重要 思维 方式 ， 使 得 
操作 对 象 的 程序 不 需要 关注 对 象 的 实际 类 型 ， 从 而 可 以 统一 处 理 不 同 对 
象 ， 但 义 能 实现 每 个 对 象 的 特有 行为 。 在 4.3 节 ， 我 们 会 进一步 介绍 动 
态 绑 定 的 实现 原理 。 














.Wy 圳 全 


本 节 介 绍 了 继承 和 多 态 的 基本 概念 。 


1) 每 个 类 有 且 只 有 一 个 父 类 ， 没 有 声明 父 类 的 ， 其 父 类 为 Object， 
子 类 继承 了 父 类 非 private 的 属性 和 方法 ， 可 以 增加 自己 的 属性 和 方法 ， 
以 及 重 写 父 类 的 方法 实现 。 

2) new 过 程 中 ， 父 类 先进 行 初 始 化 ， 可 通过 super 调 用 父 类 相应 的 
构造 方法 ， 没 有 使 用 super 的 情况 下 ， 调 用 父 类 的 默认 构造 方法 。 

3) 子 类 变量 和 方法 与 父 类 重 名 的 情况 下 ， 可 通过 super 强 制 访问 父 
类 的 变量 和 方法 。 

4) 子 类 对 象 可 以 赋值 给 父 类 引用 变量 ， 这 叫 多 态 ， 实 际 执行 调用 
的 是 子 类 实现 ， 这 叫 动态 绑 定 。 


继承 和 多 态 的 基本 概念 是 比较 简单 的 ， 子 类 继承 父 类 ， 目 动 拥有 父 
类 的 属性 和 行为 ， 并 可 扩展 属性 和 行为 ， 同 时 ， 可 重 写 父 类 的 方法 以 修 
改行 为 。 但 关于 继承 ， 还 有 很 多 细 市 ， 我 们 下 一 节 继 续 讨 论 。 











4.2 ”继承 的 细节 


本 节 探 讨 继续 的 一 些 细 节 ， 具 体 包 括 : 
构造 方法 ; 

重 名 与 静态 绑 定 ; 

重 载 和 重 写 ; 

父子 类 型 转换 ; 

继承 访问 权限 (protected) ; 
可见 性 重 写 ; 

防止 继承 〈final) 。 

下 面 我 们 逐个 介绍 。 





4.2.1 构造 方法 


前 面 我 们 说 过 ， 子 类 可 以 通过 super 调 用 父 类 的 构造 方法 ， 如 果子 类 
没有 通过 super 调 用 ， 则 会 自动 调动 父 类 的 默认 构造 方法 ， 那 如 果 父 类 没 
有 默认 构造 方法 呢 ? 如 下 所 示 : 





public class Base { 
private String member ， 
public Base(String member){ 
this.member = member ， 
} 
} 








这 个 类 只 有 一 个 带 参数 的 构造 方法 ， 没 有 默认 构造 方法 。 这 个 时 
候 ， 它 的 任何 子 类 都 必须 在 构造 方法 中 通过 super 调 用 Base 的 带 参 数 构 造 
方法 ， 如 下 所 示 ， 和 否则 ，Java 会 提示 编译 错误 。 














public class Child extends Base { 
public Child(String member) { 
super (member ) ， 











为 外 需要 注意 的 是 ， 如 果 在 父 类 构造 方法 中 调用 了 可 被 重 写 的 方 
法 ， 则 可 能 会 出 现 意 想 不 到 的 结果 。 我 们 来 看 个 例子 ， 下 面 是 基 类 代 
人 码 : 





public class Base { 
public Base(){ 
test(); 


} 
public void test(){ 
} 





构造 方法 调用 了 test() 方法 。 这 是 子 类 代码 : 





public class Child extends Base { 
private int a = 123; 
public Child(){ 


} 
public void test(){ 
System.out.printin(a); 





子 类 有 一 个 实例 变量 a， 初 始 赋值 为 123， 重 写 了 test 〈) 方法 ， 输 
出 a 的 值 。 看 下 使 用 的 代码 : 





public static void main(String[] args){ 
Child c = new Child(); 
c.test(); 





输出 结果 是 : 





123 








第 一 次 输出 为 0， 第 二 次 输出 为 123。 第 一 行为 什么 是 0 呢 ? 第 一 次 
输出 是 在 new 过 程 中 输出 的 ， 在 new 过 程 中 ， 首 先是 初始 化 父 类 ， 父 类 
构造 方法 调用 test 〈) 方法 ，test《〈) 方法 被 子 类 重 写 了 ， 就 会 调用 子 类 
的 test() 方法 ， 子 类 方法 访问 子 类 实例 变量 83， 而 这 个 时 候 子 类 的 实例 
变量 的 赋值 语句 和 构造 方法 还 没有 执行 ， 所 以 输出 的 是 其 默认 值 0。 


像 这 样 ， 在 父 类 构造 方法 中 调用 可 被 子 类 重 写 的 方法 ， 是 一 种 不 好 
的 实践 ， 容 易 引 起 混淆， 应 该 只 调用 private 的 方法 。 

















4.2.2 重 名 与 静态 绑 定 


4.1 市 我 们 提 到 ， 子 类 可 以 重 写 父 类 非 private 的 方法 ， 当 调用 的 时 
候 ， 会 动态 绑 定 ， 执 行 子 类 的 方法 。 那 实例 变量 、 静 态 方法 和 静态 变量 
呢 ? 它们 可 以 重 名 吗 ? 如 果 重 名 ， 访 问 的 是 哪 一 个 呢 ? 


重 名 是 可 以 的 ， 重 名 后 实际 上 有 两 个 变量 或 方法 。private 变 量 和 方 
法 只 能 在 类 内 访问 ， 访 问 的 也 永远 是 当前 类 的 ， 即 : 在 子 类 中 访问 的 是 
en 
王 何 关系 。 


public 变 量 和 方法 ， 则 要 看 如 何 访问 它 。 在 类 内 ， 访 问 的 是 当前 类 
的 ， 但 子 类 可 以 通过 super. 明 确 指定 访问 父 类 的 。 在 类 外 ， 则 要 看 访问 
变量 的 静态 类 型 ， 静态 类 型 是 父 类 ， 则 访问 父 类 的 变量 和 方法 ， 静 态 类 
则 访问 的 是 子 类 的 变量 和 方法 。 我 们 来 看 个 例子 ， 这 是 基 类 




















public class Base { 
public static String s = "static base"; 
public String m = "base",; 
public static void staticTest(){ 
System,.out.printJln("base static: "+s); 
} 
} 





定义 了 一 个 public 静 态 变 量 s， 一 个 public 实 例 变 量 m， 一 个 静态 方法 
staticTest。 这 是 子 类 代码 : 





public class Child extends Base { 
public static String s = "child base"; 


public String m = "child"; 
public static void staticTest(){ 
System.out.printJln("child static: "+s); 
} 
} 











子 类 定义 了 和 父 类 重 名 的 变量 和 方法 。 对 于 一 个 子 类 对 象 ， 它 束 有 
本 两 份 变 量 和 方法 ， 在 子 类 内 部 访问 的 时 候 ， 访 问 的 是 子 类 的 ， 或 者 
0 
问 聊 尺码 : 











public static void main(String[] args) { 
Child c = new Child(); 
Base b = c; 
System.out.printlin(b.s); 
System.out.printlin(b.m); 
b.staticTest(); 
System.out.printin(c.s); 
System.out.printilin(c.m); 
c.staticTest(); 





以 上 代码 创建 了 一 个 子 类 对 象 ， 然 后 将 对 象 分 别 赋 值 给 了 子 类 引用 
变量 c 和 父 类 引用 变量 b， 然 后 通过 b 和 c 分 别 引 用 变量 和 方法 。 这 里 需要 
说 明 的 是 ， 静 态 变 量 和 静态 方法 一 般 通 过 类 名 直接 访问 ， 但 也 可 以 通过 
类 的 对 象 访问 。 程 序 输出 为 : 








static_base 

base 

base static: static base 
child_base 

child 

child static: child_ base 





当 通 过 b (静态 类 型 Base) 访问 时 ， 访 问 的 是 Base 的 变量 和 方法 ， 
当 通 过 c (静态 类 型 Child) 访问 时 ， 访 问 的 是 Child 的 变量 和 方法 ， 这 称 
之 为 静态 绑 定 ， 即 访问 绑 定 到 变量 的 静态 类 型 。 静 态 绑 定 在 程序 编译 
阶段 即 可 决定 ， 而 动态 绑 定 则 要 等 到 程序 运行 时 。 实 例 变 量 、 静 态 变 
量 、 静 态 方法 、private 方 法 ， 都 是 静态 绑 定 的 。 





4.2.3 重 载 和 重 写 





重 载 是 指 方法 名 称 相同 但 参数 签名 不 同 〈 参 数 个 数 、 类 型 或 顺序 不 
同 ) ， 重 写 是 指 子 类 重 写 与 父 类 相同 参数 签名 的 方法 。 对 一 个 函数 调用 
而 言 ， 可 能 有 多 个 匹配 的 方法 ， 有 时 候选 择 哪 一 个 并 不 是 那么 明显 。 我 
们 来 看 个 例子 ， 这 是 基 类 代码 : 














public class Base { 
public int sum(int a, int b){ 
System.out.printlin("base_int_int"); 
return a+b; 
} 
} 





它 定义 了 方法 sum， 下 面 是 子 类 代码 : 





public class Child extends Base { 
public long sum(long a, long b){ 
System,out.println("child long_ long"); 
return at+b 
} 
} 





以 下 是 调用 的 代码 : 





public static void main(String[] args){ 
Child c = new Child(); 
int a = 2; 
int b = 3,; 
c.sum(a, b); 


} 





Child 和 Base 都 定义 了 sum 方 法 ， 这 里 调用 的 是 哪个 sum 方 法 呢 ? 子 
类 的 sum 方 法 参数 类 型 虽然 不 完全 匹配 但 是 是 兼容 的 ， 父 类 的 sum 方 法 
参数 类 型 是 完全 匹配 的 。 程 序 输出 为 : 





base_int_int 





父 类 类 型 完全 匹配 的 方法 被 调用 了 。 如 果 父 类 代码 改 成 下 面 这 样 
呢 ? 





public class Base { 


public long sum(int a, long b){ 
System.out.printilin("base_int_ long"); 
return a+b; 

} 

} 





父 类 方法 类 型 也 不 完全 匹配 了 。 程序 输出 为 : 
base_int_long 


调用 的 还 是 父 类 的 方法 。 父 类 和 子 类 的 两 个 方法 的 类 型 都 不 完全 区 
ed 因为 父 类 的 更 匹配 一 些 。 现 在 修改 一 下 子 类 





public class Child extends Base { 
public long sum(int a, long b){ 
System.out.printilin("child_int_ long"); 
return a+b; 
} 
} 


程序 输出 变 为 了 : 





child_int_long 


终于 调用 了 子 类 的 方法 。 可 以 看 出 ， 当 有 多 个 重 名 函数 的 时 候 ， 在 
决定 要 调用 哪个 函数 的 过 程 中 ， 首 先是 按照 参数 类 型 进行 匹配 的 ， 换 名 
IE 
行动 态 绑 定 。 











4.2.4 父子 类 型 转换 


之 前 我 们 说 过 ， 子 类 型 的 对 象 可 以 赋值 给 父 类 型 的 引用 变量 ， 这 叫 
加 上 转型 ， 那 父 类 型 的 变量 可 以 赋值 给 子 类 型 的 变量 吗 ? 或 者 说 可 以 问 
下 转型 吗 ? 语法 上 可 以 进行 强制 类 型 转换 ， 但 不 一 定 能 转换 成 功 。 我 
们 以 前 面 的 例子 来 看 : 


Base b = new Child(); 
Child c = (Child)b; 





Child c= (Child) b 就 是 将 变量 b 的 类 型 强制 转换 为 Child 并 赋值 为 
0 
和; 





Base b = new Base() 
Child c = (Child)b; 





语法 上 Java 不 会 报错 ， 但 运行 时 会 抛 出 错误 ， 错 误 为 类 型 转换 寞 


亚 


一 个 父 类 的 变量 能 不 能 转换 为 一 个 子 类 的 变量 ， 取 决 于 这 个 父 类 变 
量 的 动态 类 型 〈 即 引用 的 对 象 类 型 ) 是 不 是 这 个 子 类 或 这 个 子 类 的 子 
关 


入 o 





给 定 一 个 父 类 的 变量 能 不 能 知道 它 到 底 是 不 是 某 个 子 类 的 对 象 ， 从 
而 安全 地 进行 类 型 转换 呢 ? 答案 是 可 以 ， 通 过 instanceof 关键 字 ， 看 下 
面 代码 : 





public boolean canCast(Base b){ 
return b instanceof Child， 
} 





这 个 函数 返回 Base 类 型 变量 是 否 可 以 转换 为 Child 类 型 ，instanceof 
前 面 是 变量 ， 后 面 是 类 ， 返 回 值 是 boolean 值 ， 表 示 变 量 引用 的 对 象 是 不 
是 该 类 或 其 子 类 的 对 象 。 








4.2.5 ”继承 访问 权限 protected 


变量 和 函数 有 public/private 修 饰 符 ，public 表 示 外 部 可 以 访问 ， 
private 表 示 只 能 内 部 使 用 ， 还 有 一 种 可 见 性 介 于 中 间 的 修饰 符 
protected， 表 示 虽 然 不 能 被 外 部 任意 访问 ， 但 可 被 子 类 访问 。 另 外 ， 
protected 还 表示 可 被 同一 个 包 中 的 其 他 类 访问 ， 不 管 其 他 类 是 不 是 该 类 
的 子 类 。 我 们 来 看 个 例子 ， 这 是 基 类 代码 : 








public class Base { 
protected int currentStep; 
protected void step1(){ 


protected void step2(){ 


public void action(){ 
this.currentStep = 1; 
step1( ); 
this.currentStep = 2; 
step2(); 





action 表 示 对 外 提供 的 行为 ， 内 部 有 两 个 步骤 step1《〈) 和 
step2〈) ， 使 用 currentStep 变 量 表示 当前 进行 到 了 哪个 步骤 ， 
step1 () 、step2 () 和 currentStep 是 protected 的 ， 子 类 一 般 不 重 写 
action， 而 只 重 写 stepl1 和 step2， 同 时 ， 子 类 可 以 直接 访问 currentStep 查 
看 进行 到 了 哪 一 步 。 子 类 的 代码 是 : 








public class Child extends Base { 
protected void step1(){ 
System.out.printin("child step " + this.currentSstep); 


protected void step2(){ 
System.out.printin("child step " + this.currentSstep); 





使 用 Child 的 代码 是 : 





public static void main(String[] args){ 
Child c = new Child(); 
c.action(); 





输出 为 : 





child step 1 
child step 2 





基 类 定义 了 表示 对 外 行为 的 方法 action， 并 定义 了 可 以 被 子 类 重 写 
的 两 个 步骤 step1 () 和 step2 () ， 以 及 被 子 类 查看 的 变量 currentStep， 


子 类 通过 重 写 protected 方 法 step1 () 和 step2 〈) 来 修改 对 外 的 行为 。 


这 种 思路 和 设计 是 一 种 设计 模式 ， 称 之 为 模板 方法 。action 方 法 就 
古 一 个 模板 方法 ， 它 定义 了 实现 的 模板 ， 而 有 基体 实现 则 由 子 类 提供 。 标 
板 方 法 在 很 多 框 染 中 有 广泛 的 应 用 ， 这 是 使 用 protected 的 一 种 常见 场 


怀 o 





4.2.6 ”可 见 性 重 写 


重 写 方法 时 ， 一 般 并 不 会 修改 方法 的 可 见 性 。 但 我 们 还 是 要 说 明 一 
点 ， 重 写 时 ， 子 类 方法 不 能 降低 父 类 方法 的 可 见 性 。 不 能 降低 是 指 ， 
父 类 如 果 是 public， 则 子 类 也 必须 是 public， 父 类 如 果 是 protected， 子 类 
可 以 是 protected， 也 可 以 是 public， 即 子 类 可 以 升级 父 类 方法 的 可 见 性 
但 不 能 降低 。 看 个 例子 ， 基 类 代码 为 : 





public class Base 
protected void protect(){ 


} 
public void open(){ 
} 





子 类 代码 为 : 





public class Child extends Base { 
// 以 下 是 不 允许 的 ， 会 有 编译 错误 
//private void protect(){ 
//} 
// 以 下 是 不 允许 的 ， 会 有 编译 错误 
//protected void open(){ 
//} 


























public void protect(){ 





为 什么 要 这 样 规定 呢 ? 继 承 反 映 的 是 “is-a” 的 关系 ， 即 子 类 对 象 也 
属于 父 类 ， 子 类 必须 支持 父 类 所 有 对 外 的 行为 ， 将 可 见 性 降低 就 会 减少 
子 类 对 外 的 行为 ， 从 而 破坏 “is-a” 的 关系， 但 子 类 可 以 增加 父 类 的 行 
为 ， 所 以 提升 可 见 性 是 没有 问题 的 。 


4.2.7 ”防止 继承 final 





4.3 节 我 们 会 提 到 ， 继 承 是 把 双 刃 剑 ， 价 来 的 影响 就 是 ， 有 的 时 候 
我 们 不 希望 父 类 方法 被 子 类 重 写 ， 有 的 时 候 甚 至 不 希望 类 被 继承 ， 可 以 
通过 final 关 键 字 实现 。final 关 键 字 可 以 修饰 变量 ， 而 这 是 final 的 另 一 种 
用 法 。 一 个 Java 类 ， 默 认 情 况 下 都 是 可 以 被 继承 的 ， 但 加 了 final 关 键 字 
之 后 就 不 能 被 继承 了 ， 如 下 所 示 : 








public final class Base { 
// 主 体 代码 
} 








一 个 非 final 的 类 ， 其 中 的 public/protected 实 例 方法 默认 情况 下 都 是 
可 以 被 重 写 的 ， 但 加 了 final 关 键 字 后 就 不 能 被 重 写 了 ， 如 下 所 示 : 





public class Base { 
public final void test(){ 
System.out.printLn(" 不 能 被 重 写 " ) ， 
} 


} 








至 此 ， 关 于 Java 继 承 概念 一 些 细 市 就 介绍 完了 。 但 还 有 些 重要 的 地 
方 我 们 没有 讨论 ， 比 如 ， 创 建 子 类 对 象 的 具体 过 程 ? 动态 绑 定 是 如 何 实 
现 的 ? 让 我 们 下 节 来 探讨 继承 实现 的 基本 原理 。 


4.3 ”继承 实现 的 基本 原理 


本 市 通过 一 个 例 了 来 介绍 继承 实现 的 基本 原理 。 需要 说 明 的 是 ， 本 
节 主 要 从 概念 上 来 介绍 原理 ， 实 际 实现 细节 可 能 与 此 不 同 。 


4.3.1 示例 


基 类 Base 如 代码 清单 4-7 所 示 。 
代码 清单 4-7 演示 继承 原理 : Base 类 





public class Base { 
public static int s; 
private int ay， 














static { 
System.out.println(" 基 类 静态 代码 块 ，s: "+s); 
s=1; 


} 








System.out.println(" 基 类 实例 代码 块 ，a: "+a); 
a 三 于， 


} 

public Base(){ 
System.out.println(" 基 类 构造 方法 ，a: "+a); 
a = 2; 














protected void step(){ 
System.out.printiln("base S: " +S +" a: "+a); 


public void action(){ 
System.out.println("start"); 
step(); 
System.out.printin("end"); 
} 
} 





Base 包 括 一 个 静态 变量 s， 一 个 实例 变量 a， 一 段 静 态 初 始 化 代码 
块 ， 一 段 实例 初始 化 代码 块 ， 一 个 构造 方法 ， 两 个 方法 step 和 action。 子 
类 Child 如 代码 清单 4-8 所 示 。 


代码 清单 4-8 ”演示 继承 原理 : Child 类 





public class Child extends Base { 


public static int s; 
private int a; 


static { 
System.out.println(" 子 类 静态 代码 块 ，s: "+s); 
s = 10; 

} 

{ 


System.out.println(" 子 类 实例 代码 块 ，a: "+a); 
a = 10; 


} 

public child(){ 
System.out.println(" 子 类 构造 方法 ，a: "+a); 
a = 20; 


} 
protected void step(){ 
System.out.printin("child s: "+ S +", a: "+a); 











Child 继 承 了 Base， 也 定义 了 和 基 类 同名 的 静态 变量 s 和 实例 变量 a， 
静态 初始 化 代码 块 ， 实 例 初 始 化 代码 块 ， 构 造 方 法 ， 重 写 了 方法 step。 
使 用 的 例子 如 代码 清单 4-9 所 示 。 


代码 清单 4-9 ”演示 继承 原理 : main 方 法 





public static void main(String[] args) { 


System.out.println("---- new Child()"); 
Child c = new Child(); 
System.out.printin("\n---- c.action()"); 


c.action(); 
Base b = c; 


System.out.printin("\n---- b.action()"); 
b.action(); 

System.out.printin("\n---- b.s: "+ b.s); 
System.out.printin("\n---- C.S: " + C.SsS); 





上 面 的 代码 创建 了 Child 类 型 的 对 象 ， 赋 值 给 了 Child 类 型 的 引用 变 
量 c， 通 过 c 调 用 action 方 法 ， 又 赋值 给 了 Base 类 型 的 引用 变量 b， 通 过 b 
也 调用 了 action， 最 后 通过 b 和 c 访 问 静 态 变 量 s 并 输出 。 这 是 屏幕 的 输出 


二 
结 





- new Child() 
基 类 静态 代码 块 ，s: 0 
子 类 静态 代码 块 ，s: 0 
基 类 实例 代码 块 ，a: 0 
基 类 构造 方法 ，a: 1 
子 类 实例 代码 块 ，a: 0 


子 类 构造 方法 ，a: 10 



































-- C.action() 
Start 
child s: 10, a: 20 
end 


-- b.action() 
start 
child s: 10, a: 20 
end 

-- b.s: 1 


-- C.S: 10 





， 下 面 我 们 来 解释 一 下 背后 都 发 生 了 一 些 什么 事情 ， 从 类 的 加 载 开 


口 
4.3.2 ”类 加 载 过 程 


在 Java 中 ， 所 谓 类 的 加 载 是 指 将 类 的 相关 信息 加 载 到 内 存 。 在 Java 
中 ， 类 是 动态 加 载 的 ， 当 第 一 次 使 用 这 个 类 的 时 候 才 会 加 载 ， 加 载 一 个 
类 时 ， 会 得 看 其 父 类 是 否 已 加 载 ， 如 果 没 有 ， 则 会 加 载 其 父 类 。 

1) 一 个 类 的 信息 主要 包括 以 下 部 分 : 

类 变量 (静态 变量 ) ，; 

类 初始 化 代码 ; 

类 方法 (静态 方法 ) ; 

实例 变量 ; 

实例 初始 化 代码 ; 

实例 方法 ; 

` 父 类 信息 引用 。 

2) 类 初始 化 代码 包括 : 

定义 静态 变量 时 的 赋值 语句 ; 














静态 初始 化 代码 块 。 

3) 实例 初始 化 代码 包括 : 

定义 实例 变量 时 的 赋值 语句 ; 

实例 初始 化 代码 块 ; 

.构造 方法 。 

4) 类 加 载 过 程 包括 : 

分配 内 存 保存 类 的 信息 ; 

给 类 变量 赋 默 认 值 ; 

.加载 父 类 ; 

设置 父子 关系 ; 

执行 类 初始 化 代码 。 

注意 ， 类 初始 化 代码 ， 是 先 执 行 父 类 的 ， 再 执行 子 类 的 。 不 过 ， 父 
类 执行 时 ， 子 类 静态 变量 的 值 也 是 有 的 ， 是 默认 值 。 对 于 默认 值 ， 我 们 


之 前 说 过 ， 数 字 型 变量 都 是 0，boolean 是 false，char 是 \u0000'， 引 用 型 
变量 是 null。 














之 前 我 们 说 过 ， 内 存 分 为 栈 和 堆 ， 栈 存放 函数 的 局 部 变量 ， 而 堆 存 
放 动 态 分 配 的 对 象 ， 还 有 一 个 内 存 区 ， 和 存放 类 的 信息 ， 这 个 区 在 Java 中 
称 为 方法 区 。 


加 载 后 ，Java 方 法 区 就 有 了 一 份 这 个 类 的 信息 。 以 我 们 的 例子 来 
说 ， 有 3 份 类 信息 ， 分 别 是 Child、Base、Object， 内 存 布局 如 图 4-3 所 
和 修 。 









public String toString() { 

return getClass().getName() + '"@" + 
Integer.toHexString(hashCode()); 
} 


toString 方 法 地 址 
… 其 他 方法 地 址 








System.out.println(" 基 类 静态 代码 块 , s; "+s); 
S=1; 











> Base 
A \ 父 类 System.out.println(" 基 类 实例 代码 块 , a: "+a); 
全 三 人; 
/ 静态 变量 1(static int s) 
/ 、 System.out.println(" 基 类 构造 方法 , a; "+a); 
实例 变量 定义 private int a a=2; 
类 初始 化 代码 class_init() protected void step()! 
\ _ 过 这 System.out.printin("base s: "+S +", a; “+a); 
,实例 初始 化 代码 instance_init0 汪 
实例 方法 step() public void action()f{ 
System.out.println("start ); 
action() 一 一 step() 








(0); 
System.out.println('end ); 
] 








SS en System.outprintln(" 子 类 静态 代码 块 , s; "+S); 
we 父 类 s= 10; 
静态 变量 10(static int s) Systemout printn( 子 类 实例 代码 块 ,a: + 
实例 变量 定义 Private int a System.out,println(" 子 类 构造 方法 , a: "+a); 
类 初始 化 代码 class_init( Sa 
实例 初始 化 代码 instance_init() Protected void stepO{ 
实例 方法 ei ME Sd child s: " + Ss +", a; “+a); 








图 4-3 ”继承 原理 : 类 信息 内 存 布局 


我 们 用 class_init 〈) 来 表示 类 初始 化 代码 ， 用 instance_init () 表示 
实例 初始 化 代码 ， 实 例 初 始 化 代码 包括 了 实例 初始 化 代码 块 和 构造 方 
例子 中 只 有 一 个 构造 方法 ， 实 际 情况 则 可 能 有 多 个 实例 初始 化 方 
法 。 


本 例 中 ， 类 的 加 载 大 致 就 是 在 内 存 中 形成 了 类 似 上 面 的 布局 ， 然 后 
分 别 执 行 了 Base 和 Child 的 类 初始 化 代码 。 接 下 来 ， 我 们 看 对 象 创 建 的 过 


程 。 








4.3.3 ”对 象 创 建 的 过 程 


在 类 加 载 之 后 ，new Child〈) 就 是 创建 Child 对 象 ， 创 建 对 象 过 程 


包括 : 

1) 分 配 内 存 ; 

2) 对 所 有 实例 变量 赋 默 认 值 ; 

3) 执行 实例 初始 化 代码 。 

分 配 的 内 存 包 括 本 类 和 所 有 父 类 的 实例 变量 ， 但 不 包括 任何 静态 变 
。 实 例 初 始 化 代码 的 执行 从 父 类 开始 ， 再 执行 子 类 的 。 但 在 任何 类 执 
初始 化 代码 之 前 ， 所 有 实例 变量 都 已 设置 完 默认 值 。 
每 个 对 象 除了 保存 类 的 实例 变量 之 外 ， 还 保存 着 实际 类 信息 的 引 








村 是 





Child c=new Child 〈) ; 会 将 新 创建 的 Child 对 象 引 用 赋 给 变量 c， 
而 Baseb=c; 会 让 b 也 引用 这 个 Child 对 象 。 创 建 和 赋值 后 ， 内 存 布局 如 
图 4-4 所 示 。 
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图 4-4 ”继承 原理 : 对 象 内 存 布局 


引用 型 变量 c 和 b 分 配 在 栈 中 ， 它 们 指向 相同 的 堆 中 的 Child 对 象 。 
Child 对 象 存储 着 方法 区 中 Child 类 型 的 地 址 ， 还 有 Base 中 的 实例 变量 a 和 
Child 中 的 实例 变量 a。 创 建 了 对 象 ， 接 下 来 ， 来 看 方法 调用 的 过 程 。 














4.3.4 方法 调用 的 过 程 


我 们 先 来 看 c.action () ; ， 这 人 句 代 码 的 执行 过 程 : 


1) 查看 c 的 对 象 类 型 ， 找 到 Child 类 型 ， 在 Child 类 型 中 找 action 方 
法 ， 发 现 没 有 ， 到 父 类 中 寻找 ; 


2) 在 父 类 Base 中 找到 了 方法 action， 开 始 执 行 action 方 法 ; 


3) action 先 输出 了 start， 然 后 发 现 需要 调用 step 〈) 方法 ， 束 从 
Child 类 型 开始 寻找 step() 方法 ; 


4) 在 Child 类 型 中 找到 了 step() 方法 ， 执 行 Child 中 的 step () 方 
法 ， 执 行 完 后 返回 action 方 法 ; 


5) 继续 执行 action 方 法 ， 输 出 end。 


寻找 要 执行 的 实例 方法 的 时 候 ， 是 从 对 象 的 实际 类 型 信息 开始 碍 找 
的 ， 找 不 到 的 时 候 ， 再 查找 父 类 类 型 信息 。 


我 们 来 看 b.action () ， 这 句 代 码 的 输出 和 c.action 〈) 是 一 样 的 ， 
这 称 为 动态 绑 定 ， 而 动态 绑 定 实现 的 机 制 束 是 根据 对 象 的 实际 类 型 查找 
要 执行 的 方法 ， 子 类 型 中 找 不 到 的 时 候 再 查找 父 类 。 这 里 ， 因 为 b 和 c 指 
同 相同 的 对 象 ， 所 以 执行 结果 是 一 样 的 。 


如 果 继 承 的 层次 比较 深 ， 要 调用 的 方法 位 于 比较 上 层 的 父 类 ， 则 调 
用 的 效率 是 比较 低 的 ， 因 为 每 次 调用 都 要 进行 很 多 次 查找 。 大 多 数 系统 
使 用 一 种 称 为 虚 方法 表 的 方法 来 优化 调用 的 效率 。 


所 谓 虚 方法 表 ， 就 是 在 类 加 载 的 时 候 为 每 个 类 创建 一 个 表 ， 记 录 该 
类 的 对 象 所 有 动态 绑 定 的 方法 〈 包 括 父 类 的 方法 ) 及 其 地 址 ， 但 一 个 方 
法 只 有 一 条 记录 ， 子 类 重 写 了 父 类 方法 后 只 会 保留 子 类 的 。 对 于 本 例 来 

















说 ，Child 和 Base 的 虚 方 法 表 如 图 4-5 所 示 。 





a Object | 
| toString ] 











Base 虚 方法 表 
protected void step()!{ 


step() 一 System.out.println("base s: "+ s+", a: "+a); 
} 


action 
toString ~ 
a public void action(){ 


I 
System.out.printin("start"); 











public String toString() | 
return getClass().getName() + '@" + 


tep(); 
System,out.printin("end’); 
Integer.toHexString(hashCode()); | 
} 











Child 虚 方法 表 
action 
protected void step(){ 
step() 一 人 System.out.printin("child s; "+ s+", a; "+a); 
: } 
toString 








图 4-5 ”继承 原理 : 虚 方 法 表 


对 Child 类 型 来 说 ，action 方 法 指 问 Base 中 的 代码 ，toString 方 法 指 问 
Object 中 的 代码 ， 而 step〈) 指向 本 类 中 的 代码 。 当 通过 对 象 动态 绑 定 
方法 的 时 候 ， 只 需要 碍 找 这 个 表 就 可 以 了 ， 而 不 需要 挨个 查找 每 个 父 
类 。 接 下 来 ， 我 们 介绍 变量 访问 的 过 程 。 








4.3.5 ”变量 访问 的 过 程 








对 变量 的 访问 是 静态 绑 定 的 ， 无 论 是 类 变量 还 是 实例 变量 。 代 码 
中 演示 的 是 类 变量 : b.s 和 c.s， 通 过 对 象 访问 类 变量 ， 系 统 会 转换 为 直 
接 访问 类 变量 Base.s 和 Child.s。 


例子 中 的 实例 变量 都 是 private 的 ， 不 能 直接 访问 ; 如果 是 public 
的 ， 则 b.a 访 问 的 是 对 象 中 Base 类 定义 的 实例 变量 a， 而 c.a 访 问 的 是 对 象 
中 Child 类 定义 的 实例 变量 a。 














本 节 通 过 一 个 例子 来 介绍 类 的 加 载 、 对 象 创建 、 方 法 调用 以 及 变量 
访问 的 内 部 过 程 。 现 在 ， 我 们 应 该 对 继承 的 实现 有 了 比较 清楚 的 理解 。 
0 继承 是 把 双 刃 人 环 ， 为 什么 这 么 说 呢 ? 让 我 们 下 节 来 控 
讨 。 


4.4 为 什么 说 继承 是 把 双 刃 剑 


继承 其 实 是 把 双 刃 剑 : 一 方面 继承 是 非常 强大 的 ; 另 一 方面 继承 的 
破坏 力也 是 很 强 的 。 


继承 广泛 应 用 于 各 种 Java API[、 框 染 和 类 库 之 中 ， 一 方面 它们 内 部 
大 量 使 用 继承 ,为 一 方面 它们 设计 了 民 好 的 框架 结构 ， 提 供 了 大 量 基 类 
和 基础 公共 代码 。 使 用 者 可 以 使 用 继承 ， 重 写 适 当 方 法 进行 定制 ， 就 可 
以 简单 方便 地 实现 强大 的 功能 。 


但 ， 继 承 为 什么 会 有 破坏 力 呢 ? 主要 是 因为 继承 可 能 破坏 封装 ， 而 
封闭 可 以 说 是 程序 设计 的 第 一 原则 另外 ， 继 承 可 能 没有 反映 出 is-a 关 
系 。 下 面 我 们 详细 来 说 明 。 











4.4.1 继承 破坏 封装 





什么 是 封装 昵 ? 封装 就 是 隐藏 实现 细节 ， 提 供 简化 接口 。 使 用 者 
只 需要 关注 怎么 用 ， 而 不 需要 关注 内 部 是 怎么 实现 的 。 实 现 细节 可 以 随 
时 修改 ， 而 不 影响 使 用 者 。 函 数 是 封装 ， 类 也 是 封装 。 通 过 封装 ， 才 能 
在 更 高 的 层次 上 考虑 和 解决 问题 。 可 以 说 ， 封 装 是 程序 设计 的 第 一 原 
则 ， 没 有 封装 ， 代 码 之 间 会 到 处 存在 着 实现 细节 的 依赖 ， 则 构建 和 维护 
复杂 的 程序 是 难以 想象 的 。 


继承 可 能 破坏 封装 是 因为 子 类 和 父 类 之 间 可 能 存在 着 实现 细节 的 依 
赖 。 子 类 在 继承 父 类 的 时 候 ， 往 往 不 得 不 关注 父 类 的 实现 细 季 ， 而 父 
类 在 修改 其 内 部 实现 的 时 候 ， 如 末 不 考虑 子 类 ， 也 往往 会 影响 到 子 类 。 
我 们 通过 一 些 例 子 来 说 明 。 这 些 例 子 主要 用 于 演示 ， 可 以 基本 忽略 其 实 
际 意义 。 

















4.4.2 封装 是 如 何 被 破坏 的 


我 们 来 看 一 个 简单 的 例子 ， 基 类 Base 如 代码 清单 4-10 所 示 。 
代码 清单 4-10 ”继承 破坏 封装 : 基 类 Base 


[EE | 


public class Base { 
private static final int MAX_NUM = 1000; 
private int[] arr = new int[MAX_NUM]; 
private int count ， 
public void add(int number){ 
if(count<MAX_NUM){ 
arr[count++] = number; 
} 


} 
public void addAll(int[] numbers){ 
for(int num : numbers){ 
add (num); 





Base 提 供 了 两 个 方法 add 和 addAll， 将 输入 数字 添加 到 内 部 数组 中 。 
对 使 用 者 来 说 ，add 和 addAll 就 是 能 够 添加 数字 ， 有 具体 是 怎么 添加 的 ， 不 
用 关心 。 

子 类 代码 Child 如 代码 清单 4-11 所 示 。 


代码 清单 4-11 继承 破坏 封装 子 类 Child 











public class Child extends Base { 
private long sum; 
@Override 
public void add(int number) { 
super.add(number ) ; 
Sum+=number ， 


Q@Override 
public void addAll(int[] numbers) { 
super.addAll(numbers); 
for(int i=0;i<numbers.1length;i++){ 
sum+=numbers[i]; 
4 


} 
public long getSum() { 
return sum; 





子 类 重 写 了 基 类 的 add 和 addAll 方 法 ， 在 添加 数字 的 同时 汇总 数字 ， 
存储 数字 的 和 到 实例 变量 sum 中 ， 并 提供 了 方法 getSum 获 取 sum 的 值 。 
使 用 Child 的 代码 如 下 所 示 : 





public static void main(String[] args) { 


Child c = new Child(); 

c.addAll(new int[]{1,2,3}); 

System.out.println(c.getSum( ) ) ， 
} 





使 用 addA1 添 加 1、2、3， 期 望 的 输出 是 1+2+3=6， 实 际 输出 为 12! 
为 什么 是 12 呢 ? 查看 代码 不 难看 出 ， 同 一 个 数字 被 汇总 了 两 次 。 子 类 的 
addAll 方 法 首先 调用 了 父 类 的 add-All 方 法 ， 而 父 类 的 addAll 方 法 通过 add 
0 
忌 ]RTF。 


可 以 看 出 ， 如 果子 类 不 知道 基 类 方法 的 实现 细节 ， 它 就 不 能 正确 地 
进行 扩展 。 知道 了 错误 ， 现 在 我 们 修改 子 类 实现 ， 修 改 addAll 方 法 为 : 











Q@Override 

public void addAll(int[] numbers) { 
super.addAll(numbers); 

} 











也 就 是 说 ，addAl 方 法 不 再 进行 重复 汇总 。 这 次 ， 程 序 就 可 以 输出 
正确 结果 6 了 了 。 


但 是 ， 基 类 Base 决 定 修 改 addAll 方 法 的 实现 ， 改 为 下 面 代 码 : 











public void addAll(int[] numbers){ 
for(int num : numbers)t{ 
if(count<MAX_NUM){ 
arr[count++] = num; 





也 就 是 说 ， 它 不 再 通过 调用 add 方 法 添加 ， 这 是 Base 类 的 实现 细 
节 。 但 是 ， 修 改 了 基 类 的 内 部 细节 后 ， 上 面 使 用 子 类 的 程序 却 错 了 ， 
输出 由 正确 值 6 变 为 了 0。 

从 这 个 例子 ， 可 以 看 出 ， 子 类 和 父 类 之 间 是 细节 依赖 ， 子 类 扩展 父 
类 ， 仅 仅 知 道 父 类 能 做 什么 是 不 够 的 ， 还 需要 知道 父 类 是 怎么 做 的 ， 而 
父 类 的 实现 细节 也 不 能 随意 修改 ， 否 则 可 能 影响 子 类 。 


更 具体 地 说 ， 子 类 需要 知道 父 类 的 可 重 写 方法 之 间 的 依赖 关系 ， 











具体 到 上 例 中 ， 就 是 add 和 addAll 方 法 之 间 的 关系 ， 而 且 这 个 依赖 关系 ， 
父 类 不 能 随意 改变 。 


但 即使 这 个 依赖 关系 不 变 ， 封 闭 还 是 可 能 被 破坏 。 还 是 上 面 的 例 
子 ， 我 们 先 将 addAll 方 法 改 回 去 ， 这 次 ， 我 们 在 基 类 Base 中 添加 一 个 方 
法 clear， 这 个 方法 的 作用 是 将 所 有 添加 的 数字 清空 ， 代 人 码 如 下 : 





public void clear(){ 
for(int i=0;i<count;i++){ 
arr[i]=0; 


count = 0; 


} 





基 类 添加 一 个 方法 不 需要 告诉 子 类 ，Child 类 不 知道 Base 类 添加 了 这 
么 一 个 方法 ， 但 因为 继承 关系 ，Child 类 却 自动 拥有 了 这 么 一 个 方法 。 
因此 ，Child 类 的 使 用 者 可 能 会 这 么 使 用 Child 类 : 








public static void main(String[] args) { 
Child c = new Child(); 
c.addAll(new int[]{1,2,3}); 
c.clear(); 
c.addAll(new int[]{1,2,3}); 
System.out.printilin(c.getSum()); 





先 添加 一 次 ， 之 后 调用 clear 清 空 ， 叉 添加 一 次 ， 最 后 输出 sum， 期 
望 结果 是 6， 但 实际 输出 是 12。 因 为 Child 没 有 重 写 clear 方 法 ， 它 需要 增 
加 如 下 代码 ， 重 置 其 内 部 的 sum 值 : 





Q@Override 

public void clear() { 
super .clear(); 
this.sum = 0; 


} 





可 以 看 出 ， 父 类 不 能 随意 增加 公开 方法 ， 因 为 给 父 类 增加 就 是 给 所 
有 子 类 增加 ， 而 子 类 可 能 必须 要 重 写 该 方法 才能 确保 方法 的 正确 性 。 


总 结 一 下 : 对 于 子 类 而 言 ， 通 过 继承 实现 是 没有 安全 保障 的 ， 因 为 
父 类 修改 内 部 实现 细节 ， 它 的 功能 就 可 能 会 被 破坏 ， 而 对 于 基 类 而 言 ， 














让 子 类 继承 和 重 写 方法 ， 就 可 能 丧失 随意 修改 内 部 实现 的 自由 。 
4.4.3 ”继承 没有 反映 is-a 关 系 


继承 关系 是 设计 用 来 反映 is-a 关 系 的 ， 子 类 是 父 类 的 一 种 ， 子 类 对 
象 也 属于 父 类 ， 父 类 的 属性 和 行为 也 适用 于 子 类 。 束 像 橙子 是 水 果 一 
样 ， 水 果 有 的 属性 和 行为 ， 橙 子 也 必然 都 有 。 


但 现实 中 ， 设 计 完 全 符合 is-a 关 系 的 继承 关系 是 困难 的 。 比 如 ， 绝 
大 部 分 乌 都 会 飞 ， 可 能 就 想 给 马 类 增加 一 个 方法 HBy《〈) 表示 飞 ， 但 有 一 
些 乌 就 不 会 飞 ， 比 如 企鹅 。 


在 is-a 关 系 中 ， 重 写 方法 时 ， 子 类 不 应 该 改变 父 类 预期 的 行为 ， 但 
是 这 是 没有 办 法 约束 的 。 还 是 以 乌 为 例 ， 你 可 能 给 父 类 增加 了 fly () 方 
法 ， 对 企 物 ， 你 可 能 想 ， 企 笋 不 会 尺 ， 但 可 以 走 和 游泳 ， 束 在 企鹅 的 
fly () 方法 中 ， 实 现 了 有 关 走 或 游泳 的 逻辑 。 


继承 是 应 该 被 当 作 is-a 关 系 使 用 的 ， 但 是 ，Java 并 没有 办 法 约束 ， 
父 类 有 的 属性 和 行为 ， 子 类 并 不 一 定 都 适用 ， 子 类 还 可 以 重 写 方法 ， 实 
现 与 父 类 预期 完全 不 一 样 的 行为 。 

但 对 于 通过 父 类 引用 操作 子 类 对 象 的 程序 而 言 ， 它 是 把 对 象 当 作 父 


类 对 象 来 看 待 的 ， 期 望 对 象 符合 父 类 中 声明 的 属性 和 行为 。 如 果 不 符 
合 ， 结 果 是 什么 呢 ? 混乱 。 




















4.4.4 如 何 应 对 继承 的 双 面 性 


继承 既 强大 又 有 破坏 性 ， 那 怎么 办 呢 ? 
1) 避免 使 用 继承 ; 
2) 正确 使 用 继承 。 
我 们 先 来 看 怎么 避免 继承 ， 有 三 种 方法 : 
-使 用 final 关 键 字 ; 


.优先 使 用 组 合 而 非 继 承 ; 

.使 用 接口 。 
1. 使 用 final 避 免 继 承 

在 4.2 节 ， 我 们 提 到 过 final 类 和 final 方 法 ，final 方 法 不 能 被 重 写 ， 
final 类 不 能 被 继承 ， 我 们 没有 解释 为 什么 需要 它们 。 通 过 上 面 的 介绍 ， 
我 们 就 应 该 能 够 理解 其 中 的 一 些 原因 了 。 


给 方法 加 final 修 饰 符 ， 父 类 就 保留 了 随意 修改 这 个 方法 内 部 实现 的 
目 由 ， 使 用 这 个 方法 的 程序 也 可 以 确保 其 行为 是 符合 父 类 声明 的 。 

给 类 加 final 修 饰 符 ， 父 类 就 保留 了 随意 修改 这 个 类 实现 的 自由 ， 使 
用 者 也 可 以 放心 地 使 用 它 ， 而 不 用 担心 一 个 父 类 引用 的 变量 ， 实 际 指 问 
的 却 是 一 个 完全 不 符合 预期 行为 的 子 类 对 象 。 


2. 优 先 使 用 组 合 而 非 继承 

使 用 组 合 可 以 抵挡 父 类 变化 对 子 类 的 影响 ， 从 而 保护 子 类 ， 应 该 优 
先 使 用 组 合 。 还 是 上 面 的 例子 ， 我 们 使 用 组 合 来 重 写 一 下 子 类 ， 如 代 
码 清 单 4-12 所 示 。 


代码 清单 4-12 ”使 用 组 合 实现 子 类 Child 





public class Child { 
private Base base; 
private long sum; 
public Child(){ 
base = new Base(); 
} 


public void add(int number) { 
base.add(number ); 
Sum+=number ; 

} 

public void addAll(int[] numbers) { 
base.addAll(numbers); 
for(int i=0;i<numbers.length;i++){ 

sum+=numbers[i]; 

} 


} 

public long getSsum() { 
return sum; 

} 


} 


= 


这 样 ， 子 类 就 不 需要 关注 基 类 是 如 何 实现 的 了 ， 基 类 修改 实现 细 
节 ， 擅 加 公开 方法 ， 也 不 会 影响 到 子 类 了 。 但 组 合 的 问题 是 ， 子 类 对 象 
不 能 当 作 基 类 对 象 来 统一 处 理 了 。 解 决 方法 是 使 用 接口 。 接 口 是 什 么 


呢 ? 我 们 留待 下 章 介 绍 。 
3. 正 确 使 用 继承 
如 果 要 使 用 继承 ， 怎 么 正确 使 用 呢 ? 使 用 继承 大 概 主要 有 三 种 场 


与. 
夺 ， 














是 
第 1 种 场景 中 ， 基 类 主要 是 Java API、 其 他 框架 或 类 库 中 的 类 ， 在 这 
种 情况 下 ， 我 们 主要 通过 扩展 基 类 ， 实 现 自 定义 行为 ， 这 种 情况 下 需要 
注意 的 是 : 
. 重 写 方法 不 要 改变 预期 的 行为 ; 


阅读 文档 说 明 ， 理 解 可 重 写 方法 的 实现 机 制 ， 尤 其 是 方法 之 间 的 
依赖 关系 ; 


-在 基 类 修改 的 情况 下 ， 阅 读 其 修改 说 明 ， 相 应 修改 子 类 。 
第 2 种 场景 中 ， 我 们 写 基 类 给 别人 用 ， 在 这 种 情况 下 ， 需 要 注意 的 


是 : 
-使 用 继承 反映 真正 的 is-a 关 系 ， 只 将 真正 公共 的 部 分 放 到 基 类 ， 
:对 不 希望 被 重 写 的 公开 方法 添加 final 修 饰 符 ; 


` 写 文档 ， 说 明 可 重 写 方法 的 实现 机 制 ， 为 子 类 提供 指导 ， 告 诉 子 
类 应 该 如 何 重 写 ; 


-在 基 类 修改 可 能 影响 子 类 时 ， 写 修改 说 明 。 




















第 3 种 场景 ， 我 们 既 写 基 类 也 写 子 类 ， 关 于 基 类 ， 注 意 事 项 和 第 2 种 
场景 类 似 ， 关 于 子 类 ， 注 意 事项 和 第 1 种 场景 类 似 ， 不 过 程序 都 由 我 们 
控制 ， 要 求 可 以 适当 放松 一 些 。 


至此， 关于 继承 就 介绍 完了 ， 本 章 最 后 ， 我 们 提 到 了 一 个 概念 : 接 
口 ， 接 口 到 底 是 什么 呢 ? 让 我 们 下 章 探 讨 。 








第 5 章 ”类 的 扩展 


之 前 我 们 一 直 在 说 ， 程 序 主要 束 是 数据 以 及 对 数据 的 操作 ， 而 为 了 
方便 操作 数据 ， 高 级 语言 引入 了 数据 类 型 的 概念 。Java 定 义 了 8 种 基本 
数据 类 型 ， 而 类 相当 于 是 自 定义 数据 类 型 ， 通 过 类 的 组 合 和 继承 可 以 表 
示 和 操作 各 种 事物 或 者 说 对 象 。 


除了 基本 的 数据 类 型 和 类 概念 ， 还 有 一 些 扩展 概念 ， 包 括 接口 、 抽 
象 类 、 内 部 类 和 枚 举 。 上 一 章 我 们 提 到 ， 继 承 有 其 两 面 性 ， 蔡 代 继 承 的 
一 种 方式 是 使 用 接口 ， 接 口 到 撒 是 什么 呢 ? 此 外 ， 介 于 接口 和 类 之 间 ， 
还 有 一 个 概念 ， 抽象 类 ， 它 又 是 什么 呢 ? 一 个 类 可 以 定义 在 妨 一 个 类 内 
部 ， 称 为 内 部 类 ， 为 什么 要 有 内 部 类 ， 它 到 的 是 什么 呢 ?” 枚 举 是 一 种 特 
殊 的 数据 类 型 ， 它 有 什么 用 呢 ? 本 革 束 来 探讨 这 些 概 仿 ， 先 来 看 接口 。 








5.1 接口 的 本 质 


在 之 前 的 章节 中 ， 我 们 一 直 在 强调 数据 类 型 的 概念 ， 但 只 是 将 对 象 
看 作 属 于 某 种 数据 类 型 ， 并 按 该 类 型 进行 操作 ， 在 一 些 情 况 下 ， 并 不 能 
反映 对 象 以 及 对 对 象 操 作 的 本 质 。 


为 什么 这 么 说 呢 ? 很 多 时 候 ， 我 们 实际 上 关心 的 ， 并 不 是 对 象 的 类 
型 ， 而 是 对 象 的 能 力 ， 只 要 能 提供 这 个 能 力 ， 类 型 并 不 重要 。 我 们 来 
看 一 些 生活 中 的 例子 。 


比如 要 拍照 ， 很 多 时 候 ， 只 要 能 拍 出 符合 需求 的 照片 就 行 ， 至 于 是 
用 手机 担 ， 还 是 用 Pad 拍 ， 或 者 是 用 单反 相机 拍 ， 并 不 重要 ， 即 关心 的 
古 对 象 是 否 有 担 出 照片 的 能 力 ， 而 并 不 关心 对 象 到 故 是 什么 类 型 ， 手 
机 、Pad 或 单反 相机 都 可 以 。 


又 如 要 计算 一 组 数字 ， 只 要 能 计算 出 正确 结果 即 可 ， 全 于 是 由 人 心 
算 ， 用 算盘 算 ， 用 计算 器 算 ， 用 计算 机 软件 算 ， 并 不 重要 ， 即 关心 的 是 
对 象 是 否 有 计算 的 能 力 ， 而 并 不 关心 对 象 到 底 是 算盘 还 是 计算 器 。 


再 如 要 将 冷水 加 热 ， 只 要 能 得 到 热 水 即 可 ， 人 至 于 是 用 电磁 炉 加 热 ， 
用 燃气 灶 加 热 ， 还 是 用 电热 水 壹 加热 ， 并 不 重要 ， 即 重要 的 是 对 象 是 否 
有 加 热 水 的 能 力 ， 而 并 不 关心 对 象 到 底 是 什么 类 型 。 


在 这 些 情况 中 ， 类 型 并 不 重要 ， 重 要 的 是 能 力 。 那 如 何 表示 能 
呢 ? 接口 。 下 面 就 来 详细 介绍 接口 ， 包 括 其 概念 、 用 法 、 一 些 细节 ， 以 
及 如 何 用 接口 蔡 代 继承 。 




















5.1.1 接口 的 概念 





接口 这 个 概念 在 生活 中 并 不 陌生 ， 电 子 世 界 中 一 个 常见 的 接口 就 是 
USB 接 口 。 计 算 机 往往 有 多 个 USB 接 口 ， 可 以 插 各 种 USB 设 备 ， 如 键 
盘 、 鼠 标 、U 盘 、 摄 像 头 、 手 机 等 。 


接口 声明 了 一 组 能 力 ， 但 它 自 己 并 没有 实现 这 个 能 力 ， 它 只 是 一 个 
约定 。 接 口 涉 及 交互 两 方 对 象 ， 一 方 需要 实现 这 个 接口 ， 为 一 方 使 用 这 











个 接口 ， 但 双方 对 象 并 不 直接 互相 依赖 ， 它 们 只 是 通过 接口 间接 交互 ， 
如 图 5-1 所 示 。 


接口 对 象 乙 
对 象 二 A (实现 接口 A ) 


图 5-1 接口 的 概念 


拿 上 面 的 USB 接 口 来 说 ， USB 协 议 约定 USB 设备 宕 要 实现 的 能 
力 ， 每 个 USB 设 备 都 需要 实现 这 些 能 力 ， 计算 机 使 用 USB 协 议 与 USB 设 
备 交 互 ， 计 算 机 和 USB 设 备 互 不 依赖 但 可 以 通过 USB 接 口 相互 交互 。 
下 面 我 们 来 看 Java 中 的 接口 。 





5.1.2 定妆 伴 口 


我 们 通过 一 个 例子 来 说 明 Java 中 接口 的 概念 。 这 个 例子 是 “比较 ”， 
很 多 对 象 都 可 以 比较 ， 对 于 求 最 大 值 、 求 最 小 值 、 排 序 的 程序 而 言 ， 它 
们 其 实 并 不 关心 对 象 的 类 型 是 什么 ， 只 要 对 象 可 以 比较 就 可 以 了 ， 也 者 
说 ， 它 们 关心 的 是 对 象 有 没有 可 比较 的 能 力 。 Java a 
OA 0 以 表示 可 比较 的 能 力 ， 但 它 使 用 了 泛 型 ， 而 我 们 还 没 
有 介绍 泛 型 ， 所 以 本 节 先 目 己 定 义 一 个 Comparable 接 口 ， 叫 
Nv i ani 


首先 来 定义 这 个 接口 ， 代 码 如 下 : 








public interface MyComparable { 
int compareTo(Object other); 
} 


定义 接口 的 代码 解释 如 下 : 





1) Java 使 用 interface 这 个 关键 字 来 声明 接口 ， 修 饰 符 一 般 都 是 
pubjlic 。 





2) interface 后 面 就 是 接口 的 名 字 MyComparable。 

3) 接口 定义 里 面 ， 声 明了 一 个 方法 compareTo， 但 没有 定义 方法 
体 ，Java 8 之 前 ， 接 口内 不 能 实现 方法 。 接 口 方法 不 需要 加 修饰 符 ， 加 
与 不 加 相当 于 都 是 public abstract。 

再 来 解释 compareTo 方 法 : 


1) 方法 的 参数 是 一 个 Object 类 型 的 变量 other， 表 示 男 一 个 参与 比 
较 的 对 象 。 


2) 第 一 个 参与 比较 的 对 象 是 自己 。 


3) 返回 结果 是 int 类 型 ，-1 表 示 目 己 小 于 参数 对 象 ，0 表 示 相 同 ，1 
表示 大 于 参数 对 象 。 


接口 与 类 不 同 ， 它 的 方法 没有 实现 代码 。 定 义 一 个 接口 本 身 并 没有 
做 什么 ， 也 没有 太 大 的 用 处 ， 它 还 需要 至 少 两 个 参与 者 : 一 个 需要 实现 
接口 ， 男 一 个 使 用 接口 。 我 们 先 来 实现 接口 。 























5.1.3 ”实现 接口 








类 可 以 实现 接口 ， 表 示 类 的 对 象 具 有 接口 所 表示 的 能 力 。 在 此 以 上 
一 半 介 绍 过 的 Point 类 来 说 明 。 我 们 让 Point 具 备 可 以 比较 的 能 力 ，Point 
之 间 怎 么 比较 呢 ? 我 们 假设 按照 与 原点 的 距离 进行 比较 ，Point 类 代码 如 
代码 清单 5-1 所 示 。 


代码 清单 5-1 Point 类 代码 : 实现 了 MyComparable 











public class Point implements MyComparable { 
private int x; 
private int y; 
public Point(int x, int y) { 
this.x = x; 
this.y = y; 


} 
public double distance(){ 


return Math.sdqrt(Xx*Xx+yxy)， 


Qoverride 
public int compareTo(Object other ) { 
if(!(other instanceof Point ) ){ 
throw new IllegalArgumentException(); 


Point otherPoint = (Point)other; 
double delta = distance() - otherPoint ,distance() ; 
if(delta<0){ 
return -1; 
}else if(delta>0)t{ 
return 1; 
}elsef{f 
return ©; 
} 


} 

@Override 

public String toString() { 
return Wi Gi > i A si 





代码 解释 如 下 : 


1) Java 使 用 implements 这 个 关键 字 表 示 实 现 接 口 ， 前 面 是 类 名 ， 后 
面 是 接口 名 。 


2) 实现 接口 必须 要 实现 接口 中 声明 的 方法 ，Point 实 现 了 compareTo 
方法 。 














再 来 解释 Point 的 compareTo 实 现 。 


1) Point 不 能 与 其 他 类 型 的 对 象 进 行 比较 ， 它 首先 检查 要 比较 的 对 
象 是 否 是 Point 类 型 ， 如 果 不 是 ， 使 用 throw 抛 出 一 个 异 币 ， 措 第 将 在 下 
一 草 介 绍 ， 此 处 可 以 忽略 。 


2) 如 果 是 Point 类 型 ， 则 使 用 强制 类 型 转换 将 Object 类 型 的 参数 
other 转换 为 Point 类 型 的 参数 otherPoint。 


3) 这 种 显 式 的 类 型 检查 和 强制 转换 是 可 以 使 用 泛 型 机 制 避免 的 ， 
第 8 章 我 们 再 介绍 泛 型 。 


一 个 类 可 以 实现 多 个 接口 ， 表 明 类 的 对 象 具 备 多 种 能 力 ， 各 个 接口 
之 间 以 逗号 分 隔 ， 语 法 如 下 所 示 : 

















public class Test implements Interface1, Interface2 { 


// 主体 代码 
} 











定义 和 实现 了 接口 ， 接 下 来 我 们 来 看 怎么 使 用 接口 。 
5.1.4 使 用 接口 
与 类 不 同 ， 接 口 不 能 new， 不 能 直接 创建 一 个 接口 对 象 ， 对 象 只 能 


通过 类 来 创建 。 但 可 以 声明 接口 类 型 的 变量 ， 引 用 实现 了 接口 的 类 对 
象 。 比 如 ， 可 以 这 样 : 








MyComparable p1 = new Point(2,3); 
MyComparable p2 = new Point(1,2); 
System,out.println(p1.compareTo(p2)); 








p1 和 p2 是 MyComparable 类 型 的 变量 ， 但 引用 了 Point 类 型 的 对 象 ， 
之 所 以 能 赋值 是 因为 Point 实 现 了 MyComparable 接 口 。 如 果 一 个 类 型 实 
现 了 多 个 接口 ， 那 么 这 种 类 型 的 对 象 就 可 以 被 赋值 给 任 一 接口 类 型 的 变 
量 。p1 和 p2 可 以 调用 MyComparable 接 口 的 方法 ， 也 只 能 调用 
0 口 的 方法 ， 实 际 执行 时 ， 执 行 的 是 具体 实现 类 的 代 


为 什么 Point 类 型 的 对 象 非 要 赋值 给 MyComparable 类 型 的 变量 呢 ? 
在 以 上 代码 中 ， 确 实 没 必要 。 但 在 一 些 程序 中 ， 代 码 并 不 知道 具体 的 类 
型 ， 这 才 是 接口 发 挥 威力 的 地 方 。 我 们 来 看 下 面 使 用 MyComparable 接 
口 的 例子 ， 如 代码 清单 5-2 所 示 。 


代码 清单 5-2 ”使 用 MyComparable 的 示例 : CompUtil 








public class CompUtil { 
public static Object max(MyComparable[] objs){ 
if(objs==null| |objs.length==0){ 
return null; 


} 
MyComparable max = objs[0]; 
for(int i=1; i<objs.length; i++){ 
if(max.compareTo(objs[i])<0){ 
max = objs[i]; 


return max; 
} 
public static void sort(Comparable[] objs){ 
for(int i=0; i<objs.length; i++){ 
int min = i; 
for(int j=i+1; j<objs.length; j++){ 
if(objs[j].compareTo(objs[min])<0){ 
min = j; 
} 


} 

if(min!=i){ 
Comparable temp = objs[i]; 
objs[i] = objs[min]; 
objs[min] = temp; 





类 CompUtil 提 供 了 两 个 方法 ，max 获 取 传 入 数组 中 的 最 大 值 ，sort 
对 数组 升序 排序 ， 参 数 都 是 MyComparable 类 型 的 数组 ，sort 使 用 的 是 简 
单 选择 排序 ， 具 体 算法 我 们 就 不 介绍 了 。 


可 以 看 出 ， 这 个 类 是 针对 MyComparable 接 口 编程 ， 它 并 不 知道 具 
体 的 类 型 是 什么 ， 也 并 不 关心 ， 但 却 可 以 对 任意 实现 了 MyComparable 
接口 的 类 型 进行 操作 。 我 们 来 看 如 何 对 Point 类 型 进行 操作 ， 代 码 如 下 : 











Point[] points = new Point[]{ 
new Point(2,3), new Point(3,4), new Point(1,2) 


/ 
System.out.println("max: " + CompUtil.max(points)); 
CompUtil.sort(points); 
System.out.println("sort: "+ Arrays.toString(points)); 





以 上 代码 创建 了 一 个 Point 类 型 的 数组 points， 然 后 使 用 CompUtil 的 
max 方 法 获取 最 大 值 ， 使 用 sort 排 序 ， 并 输出 结果 ， 输 出 如 下 : 





max: (3,4) 
sort: [(1,2), (2,3), (3,4)] 








这 里 演示 的 是 对 Point 数 组 操作 ， 实 际 上 可 以 针对 任何 实现 了 
MyComparable 接 口 的 类 型 数组 进行 操作 。 这 就 是 接口 的 威力 ， 可 以 
说 ， 人 针对 接口 而 非 具体 类 型 进行 编程 ， 是 计算 机 程序 的 一 种 重要 思维 方 
式 。 接口 很 多 时 候 反 映 了 对 象 以 及 对 对 象 操作 的 本 质 。 它 的 优点 有 很 
多 ， 首 先是 代码 复 用 ， 同 一 套 代 码 可 以 处 理 多 种 不 同类 型 的 对 象 ， 只 





要 这 些 对 象 都 有 相同 的 能 力 ， 如 CompUtil。 


接口 更 重要 的 是 降低 了 和 耦合， 提高 了 灵活 性 。 使 用 接口 的 代码 依 
赖 的 是 接口 本 身 ， 而 非 实 现 接口 的 具体 类 型 ， 程 序 可 以 根据 情况 将 换 接 
口 的 实现 ， 而 不 影响 接口 使 用 者 。 解 决 复杂 问题 的 关键 是 分 而 治之 ， 将 
复杂 的 大 问题 分 解 为 小 问题 ， 但 小 问题 之 间 不 可 能 一 点 关系 没有 ， 分 解 
的 核心 就 是 要 降低 厢 合 ， 提 高 灵活 性 ， 接 口 为 恰当 分 解 提 供 了 有 力 的 工 


了 








5.1.5 接口 的 细节 





前 面 介 绍 了 接口 的 基本 内 容 ， 接 口 还 有 一 些 细节 ， 包 括 : 
-接口 中 的 变量 。 

-接口 的 继承 。 

类 的 继承 与 接口 。 





"instanceof。 
下 面具 体 介 绍 。 

(1) 接口 中 的 变量 
接口 中 可 以 定义 变量 ， 语 法 如 下 所 示 : 


public interface Interface1 { 
public static final int a = 0; 


} 


这 里 定义 了 一 个 变量 int a， 修 饰 符 是 public static final， 但 这 个 修饰 
符 是 可 选 的 ， 即 使 不 写 ， 也 是 public static final。 这 个 变量 可 以 通过 “ 接 
口 名 .变量 名 ”的 方式 使 用 ， 如 Interface1.a。 

(2) 接口 的 继承 


接口 也 可 以 继承 ， 一 个 接口 可 以 继承 其 他 接口 ， 继 承 的 基本 概念 与 








类 一 样 ， 但 与 类 不 同 的 是 ， 接 口 可 以 有 多 个 父 接口 ， 代 码 如 下 所 示 : 





public interface IBase1 { 
void method1( ) ; 
} 


public interface IBase2 { 
void method2(); 


} 
public interface IChild extends IBasei1, IBase2 { 





IChild 有 IBasel 和 IBase2 两 个 父 类 ， 接 口 的 继承 同样 使 用 extends 关 键 
字 ， 多 个 父 接 口 之 间 以 逗号 分 隔 。 


(3) 类 的 继承 与 接口 


类 的 继承 与 接口 可 以 共存 ， 换 句 话 说， 类 可 以 在 继承 基 类 的 情况 
下 ， 同 时 实现 一 个 或 多 个 接口 ， 语 法 如 下 所 示 : 











public class Child extends Base Implements IChild { 
// 主 体 代码 





关键 字 extends 要 放 在 implements 之 前 。 
(4) instanceof 


与 类 一 样 ， 接 口 也 可 以 使 用 instanceof 关 键 字 ， 用 来 判断 一 个 对 象 是 
否 实 现 了 某 接口 ， 例 如 : 





Point p = new Point(2,3); 

if(p instanceof MyComparable){ 
System.out.println("comparable"); 

} 





5.1.6 ”使 用 接口 替代 继承 


上 一 章 我 们 提 到 ， 可 以 使 用 组 合 和 接口 替代 继承 。 怎 么 蔡 代 呢 ? 





继承 至 少 有 两 个 好 处 :一 个 是 复 用 代码 ;， 男 一 个 是 利用 多 态 和 动态 
绑 定 统一 处 理 多 种 不 同 子 类 的 对 象 。 使 用 组 合 奉 代 继承 ， 可 以 复 用 代 
码 ， 但 不 能 统一 处 理 。 使 用 接口 蔡 代 继承 ， 针 对 接口 编程 ， 可 以 实现 统 
一 处 理 不 同类 型 的 对 象 ， 但 接口 没有 代码 实现 ， 无 法 复 用 代码 。 将 组 合 
和 接口 结合 起 来 答 代 继承 ， 惑 既 可 以 统一 处 理 ， 又 可 以 复 用 代码 了 。 


我 们 还 是 以 4.4 市 的 例子 来 说 明 ， 先 增加 一 个 接口 [Add， 代 码 如 
下 : 








public interface IAdd { 

void add(int number); 

void addAll(int[] numbers); 
} 





修改 Base 代 码 ， 让 它 实现 IAdd 接 口 ， 代 码 基本 不 变 : 





public class Base implements IAdd { 
// 主 体 代码 ， 与 代码 清单 4-10 一 样 











修改 Child 代 码 ， 也 是 实现 IAdd 接 口 ， 代 码 基本 不 变 : 





public class Child implements IAdd { 
// 主 体 代码 ， 组 合 使 用 Base， 与 代码 清单 4-12 一 样 
































Child 复 用 了 Base 的 代码 ， 又 都 实现 了 IAdd 接 口 ， 这 样 ， 既 复 用 代 
码 ， 又 可 以 统一 处 理 ， 还 不 用 担心 破坏 封装 。 


5.1.7 Java 8 和 Java 9 对 接口 的 增强 


需要 说 明 的 是 ， 前 面 介 绍 的 都 是 Java 8 之 前 的 接口 概念 ，Java 8 和 
Java 9 对 接口 做 了 一 些 增 强 。 在 Java 8 之 前 ， 接 口中 的 方法 都 是 抽象 方 
法 ， 都 没有 实现 体 ，Java 8 允许 在 接口 中 定义 两 类 新 方法 : 静态 方法 和 
默认 方法 ， 它们 有 实现 体 ， 比 如 : 











public interface IDemo { 


void hello(); 
public static void test() { 
System.out.println("hello"); 


} 

default void hi() { 
System.out.printlin("hi"); 

} 


} 





test〈() 就 是 一 个 静态 方法 ， 可 以 通过 IDemo.test〈() 调用 。 在 接口 
不 能 定义 静态 方法 之 前 ， 相 关 的 静态 方法 往往 定义 在 单独 的 类 中 ， 比 
如 ，Java API 中 ，Collection 接 口 有 一 个 对 应 的 单独 的 类 Collections， 在 
Java8 中 ， 就 可 以 直接 写 在 接口 中 了 ， 比 如 Comparator 接 口 就 定义 了 多 
个 静态 方法 。 


hi〈) 是 一 个 默认 方法 ， 用 关键 字 default 表 示 。 默 认 方法 与 抽象 方 
法 都 是 接口 的 方法 ， 不 同 在 于 ， 默 认 方法 有 默认 的 实现 ， 实 现 类 可 以 改 
变 它 的 实现 ， 也 可 以 不 改变 。 引 入 默认 方法 主要 是 函数 式 数据 处 理 的 需 
人 关于 函数 式 数据 处 理 ， 会 在 第 26 章 
由 Do。 





在 没有 默认 方法 之 前 ，Java 是 很 难 给 接口 增加 功能 的 ， 比 如 List 接 
口 〈 第 9 章 介 绍 ) ， 因 为 有 太 多 非 Java JDK 控 制 的 代码 实现 了 该 接口 ， 
如 果 给 接口 增加 一 个 方法 ， 则 那些 接口 的 实现 就 无 法 在 新 版 Java 上 运 
行 ， 必 须 改写 代码 ， 实 现 新 的 方法 ， 这 显然 是 无 法 接受 的 。 函 数 式 数 据 
处 理 需 要 给 一 些 接口 增加 一 些 新 的 方法 ， 所 以 束 有 了 默认 方法 的 概念 ， 
接口 增加 了 新 方法 ， 而 接口 现 有 的 实现 类 也 不 需要 必须 实现 。 看 一 些 例 
子 ，List 接 口 增 加 了 sort 方 法 ， 其 定义 为 : 

















default void sort(Comparator<? Super E> c) { 
Object[] a = this.toArray(); 
Arrays.sort(a, (Comparator) c); 
ListIterator<E> i = this.]listIterator(); 
for(Object e : a) { 
i.next(); 
i.set((E) e); 
} 
} 





Collection 接 口 增 加 了 stream 方 法 ， 其 定义 为 : 





default Stream<E> stream() { 
return StreamSupport.stream(spliterator(), false); 





在 Java 8 中 ， 静 态 方 法 和 默认 方法 都 必须 是 public 的 ，Java 9 去 除了 
这 个 限制 ， 它 们 都 可 以 是 private 的 ， 引 入 private 方 法 主要 是 为 了 方便 多 
个 静态 或 默认 方法 复 用 代码 ， 比 如 : 





public interface IDemoPrivate { 
private void common() { 
System.out.println("common"); 


} 
default void actionA() { 
common( ); 


} 
default void actionB() { 
common( ); 





这 里 ，actionA 和 actionB 两 个 默认 方法 共享 了 相同 的 common () 方 
法 的 代码 。 


8 小结 


本 节 我 们 谈 了 数据 类 型 思维 的 局 限 ， 提 到 了 很 多 时 候 关 心 的 是 能 
力 ， 而 非 类 型 ， 所 以 引入 了 接口 ， 介 绍 了 Java 中 接口 的 概念 和 细节 。 针 
对 接口 编程 是 一 种 重要 的 程序 思维 方式 ， 这 种 方式 不 仅 可 以 复 用 代码 ， 
还 可 以 降低 耦合 ， 提 高 灵活 性 ， 是 分 解 复 杂 问 题 的 一 种 重要 工具 。 


接口 不 能 创建 对 象 ， 没 有 任何 实现 代码 (Java 8 之 前 ) ， 而 之 前 介 
绍 的 类 都 有 完整 的 实现 ， 都 可 以 创建 对 象 。Java 中 还 有 一 个 介 于 接口 和 
类 之 间 的 概念 : 抽象 类 ， 它 有 什么 用 呢 ? 











5.2 ”抽象 类 


顾名思义 ， 抽 象 类 就 是 抽象 的 类 。 抽 象 是 相对 于 具体 而 言 的 ， 一 般 
而 言 ， 有 具体 类 有 直接 对 应 的 对 象 ， 而 抽象 类 没有 ， 它 表达 的 是 抽象 概 
念 ， 一 般 是 具体 类 的 比较 上 层 的 父 类 。 比 如 ， 狗 是 具体 对 象 ， 而 动物 
则 是 抽象 概念 ， 樱桃 是 具体 对 象 ， 而 水 果 则 是 抽象 概念 ;正方形 是 具体 
对 象 ， 而 图 形 则 是 抽象 概念 。 下 面 我 们 通过 图 形 处 理 中 的 一 些 概念 来 说 
明 Java 中 的 抽象 类 。 











5.2.1 抽象 方法 和 抽象 类 


之 前 我 们 介绍 过 图 形 类 Shape， 它 有 一 个 方法 draw () 。Shape 其 实 
是 一 个 抽象 概念 ， 它 的 draw() 方法 其 实 并 不 知道 如 何 实 现 ， 只 有 子 类 
才 知 道 。 这 种 只 有 子 类 才 知 道 如 何 实现 的 方法 ， 一 般 被 定义 为 抽象 方法 











抽象 方法 是 相对 于 有 具体 方法 而 言 的 ， 具 体 方法 有 实现 代码 ， 而 抽象 
方法 只 有 声明 ， 没 有 实现 。 上 和 节 介 绍 的 接口 中 的 方法 《〈 非 Java 8 引入 的 
静态 和 默认 方法 ) 束 都 是 抽象 方法 。 


”抽象 方法 和 抽象 类 都 使 用 abstract 这 个 关键 字 来 声明 ， 语 法 如 下 所 
外: 





public abstract class Shape { 
// 其 他 代码 
public abstract void draw(); 


} 








定义 了 抽象 方法 的 类 必须 被 声明 为 抽象 类 ， 不 过 ， 抽 象 类 可 以 没有 
抽象 方法 。 抽 象 类 和 具体 类 一 样 ， 可 以 定义 具体 方法 、 实 例 变 量 等 ， 它 
和 具体 类 的 核心 区 别 是 ， 抽 象 类 不 能 创建 对 象 〈“ 比 如 ， 不 能 使 用 new 
Shape () ) ， 而 具体 类 可 以 。 


抽象 类 不 能 创建 对 象 ， 要 创建 对 象 ， 必 须 使 用 它 的 具体 子 类 。 一 个 
类 在 继承 抽象 类 后 ， 必 须 实现 抽象 类 中 定义 的 所 有 抽象 方法 ， 除 非 它 自 


己 也 声明 为 抽象 类 。 贺 类 的 实现 代码 ， 如 下 所 示 : 





public class Circle extends Shape { 
// 其 他 代码 
Q@override 
public void draw() { 
// 主 体 代码 


} 
} 








同 实 现 了 draw() 方法 。 与 接口 类 似 ， 抽 象 类 虽然 不 能 使 用 new， 
但 可 以 声明 抽象 类 的 变量 ， 引 用 抽象 类 具体 子 类 的 对 象 ， 如 下 所 示 : 





Shape shape = new Circle(); 
shape.draw( ); 











shape 是 抽象 类 Shape 类 型 的 变量 ， 引 用 了 具体 子 类 Circle 的 对 象 ， 调 
用 draw() 方法 将 调用 Circle 的 draw 代 码 。 


5.2.2 ”为 什么 需要 抽象 类 


抽象 方法 和 抽象 类 看 上 去 是 多 余 的 ， 对 于 抽象 方法 ， 不 知道 如 何 实 
现 ， 定 义 一 个 空 方 法 体 不 就 行 了 吗 ? 而 抽象 类 不 让 创建 对 象 ， 看 上 去 只 
古 增加 了 一 个 不 必要 的 限制 。 


引入 抽象 方法 和 抽象 类 ， 是 Java 提 供 的 一 种 语法 工具 ， 对 于 一 些 类 
和 方法 ， 引 导 使 用 者 正确 使 用 它们 ， 减 少 误 用 。 使 用 抽象 方法 而 非 空 方 
法 体 ， 子 类 就 知道 它 必 须要 实现 该 方法 ， 而 不 可 能 忽略 ， 行 忽略 Java 编 
译 絮 会 提示 错误 。 使 用 抽象 类 ， 类 的 使 用 者 创建 对 象 的 时 候 ， 就 知道 必 
须要 使 用 某 个 具体 子 类 ， 而 不 可 能 误 用 不 完整 的 父 类 。 


无 论 是 编写 程序 ， 还 是 平时 做 其 他 事情 ， 每 个 人 都 可 能 会 犯错 ， 减 
少 错误 不 能 只 依赖 人 的 优秀 素质 ， 还 需要 一 些 机 制 ， 使 得 一 个 普通 人 都 
0 0 
儿 制 。 




















5.2.3 ”抽象 类 和 接口 


抽象 类 和 接口 有 类 似 之 处 :都 不 能 用 于 创建 对 象 ， 接 口中 的 方法 其 
实 部 是 抽象 方法 。 如 果 抽 象 类 中 只 定义 了 抽象 方法 ， 那 抽象 类 和 接口 就 
更 像 了 。 但 抽象 类 和 接口 根本 上 是 不 同 的 ， 接 口中 不 能 定义 实例 变量 ， 
而 抽象 类 可 以 ， 一 个 类 可 以 实现 多 个 接口 ， 但 只 能 继承 一 个 类 。 


抽象 类 和 接口 是 配合 而 非 蔡 代 关 系 ， 它 们 经 常 一 起 使 用 ， 接 口 声明 
能 力 ， 抽 象 类 提供 默认 实现 ， 实 现 全 部 或 部 分 方法 ， 一 个 接口 经 常 有 一 
个 对 应 的 抽象 类 。 比如 ， 在 Java 类 库 中 ， 有 : 

Collection 接口 和 对 应 的 AbstractCollection 抽 象 类 。 


-List 接口 和 对 应 的 AbstractList 抽 象 类 。 











.Map 接 口 和 对 应 的 AbstractMap 抽 象 类 。 


对 于 需要 实现 接口 的 具体 类 而 言 ， 有 两 个 选择 : 一 个 是 实现 接口 ， 
目 己 实现 全 部 方法 ， 另 一 个 则 是 继承 抽象 类 ， 然 后 根据 需要 重 写 方法 。 


继承 的 好 处 是 复 用 代码 ， 只 重 写 再 要 的 部 分 即 可 ， 需 要 编写 的 代码 
比较 少 ， 容 易 实现 。 不 过 ， 如 果 这 个 具体 类 已 经 有 父 关 了 ， 那 就 只 能 选 
择 实现 接口 了 。 


我 们 以 一 个 例子 来 进一步 说 明 这 种 配合 关系 。 前 面 引 入 了 IAdd 接 
口 ， 我 们 实现 一 个 抽象 类 AbstractAdder， 代 人 码 如 下 : 


























public abstract class AbstractAdder implements IAdd { 
Q@Override 
public void addAll(int[] numbers) { 
for(int num : numbers){ 
add (num); 





这 个 抽象 类 提供 了 addAll 方 法 的 实现 ， 它 通过 调用 add 方 法 来 实现 ， 
而 add 方 法 是 一 个 抽象 方法 。 这 样 ， 对 于 需要 实现 IAdd 接 口 的 类 来 说 ， 
它 可 以 选择 直接 实现 IAdd 接 口 ， 或 者 从 AbstractAdder 类 继承 ， 如 果 继 
承 ， 只 需要 实现 add 方 法 就 可 以 了 。 这 里 ， 我 们 让 原 有 的 Base 类 继承 
AbstractAdder， 代 码 如 下 所 示 : 








public class Base extends AbstractAdder { 
private static final int MAX_NUM = 1000; 
private int[] arr = new int[MAX_NUM]; 
private int count; 
Q@Override 
public void add(int number){ 
if(count<MAX_NUM){ 
arr[count++] = number; 
} 
} 
} 





5.2d， 小结 





本 节 介 绍 了 抽象 类 ， 相 对 于 具体 类 ， 它 用 于 表达 抽象 概念 ， 里 然 从 
语法 上 抽象 类 不 是 必需 的 ， 但 它 能 使 程序 更 为 清晰 ， 可 以 减少 误 用 。 抽 
象 类 和 接口 经 党 相互 配合 ， 接 口 定义 能 力 ， 而 抽象 类 提供 默认 实现 ， 方 
便 子 类 实现 接口 。 

在 目前 关于 类 的 描述 中 ， 每 个 类 都 是 独立 的 ， 都 对 应 一 个 Java 源 代 


码 文件 ， 但 在 Java 中 ， 一 个 类 还 可 以 放 在 男 一 个 类 的 内 部 ， 称 之 为 内 部 
类 。 为 什么 要 将 一 个 类 放 到 别 的 类 内 部 呢 ? 让 我 们 下 节 探 讨 。 








5.3 ”内 部 类 的 本 质 


之 前 我 们 所 说 的 类 都 对 应 于 一 个 独立 的 Java 源 文件 ， 但 一 个 类 还 可 
以 放 在 男 一 个 类 的 内 部 ， 称 之 为 内 部 类 ， 相 对 而 言 ， 包 含 它 的 类 称 之 为 


外 部 类 。 


一 般 而 言 ， 内 部 类 与 包含 它 的 外 部 类 有 比较 密切 的 关系 ， 而 与 其 他 
类 关系 不 大 ， 定 义 在 类 内 部 ， 可 以 实现 对 外 部 完全 隐藏 ， 可 以 有 更 好 的 
封装 性 ， 代 码 实现 上 也 往往 更 为 简洁 。 


不 过 ， 内 部 类 只 是 Java 编 译 右 的 概念 ， 对 于 Java 虚 拟 机 而 言 ， 它 是 
不 知道 内 部 类 这 回 事 的 ， 每 个 内 部 类 最 后 都 会 被 编译 为 一 个 独立 的 类 ， 
生成 一 个 独立 的 字 节 码 文 件 。 

也 束 是 说 ， 每 个 内 部 类 其 实 都 可 以 被 蔡 换 为 一 个 独立 的 类 。 当 然 ， 
这 是 单纯 就 技术 实现 而 言 。 内 部 类 可 以 方便 地 访问 外 部 类 的 私有 变量 ， 
可 以 声明 为 private 从 而 实现 对 外 完全 隐藏 ， 相 关 代 码 写 在 一 起 ， 写 法 也 
更 为 简洁 ， 这 些 都 是 内 部 类 的 好 处 。 

在 Java 中 ， 根 据 定义 的 位 置 和 方式 不 同 ， 主 要 有 4 种 内 部 类 。 

:静态 内 部 类 。 

:成 员 内 部 类 。 

:方法 内 部 类 。 

.匿名 内 部 类 。 

其 中 ， 方法 内 部 类 是 在 一 个 方法 内 定义 和 使 用 的 ;， 匿名 内 部 类 使 用 
范围 更 小 ， 它 们 都 不 能 在 外 部 使 用 ;成 员 内 部 类 和 静态 内 部 类 可 以 被 外 


部 使 用 ， 不 过 它们 都 可 以 被 声明 为 private， 这 样 ， 外 部 就 不 能 使 用 了 。 
接 下 来 ， 我 们 逐个 介绍 这 些 内 部 类 的 语法 、 实 现 原理 以 及 使 用 场景 。 























5.3.1 静态 内 部 类 











静态 内 部 类 与 静态 变量 和 静态 方法 定义 的 位 置 一 样 ， 也 融 有 static 关 
键 字 ， 只 是 它 定 义 的 是 类 ， 下 面 我 们 介绍 它 的 语法 、 实 现 原 理 和 应 用 场 
景 。 我 们 看 个 静态 内 部 类 的 例子 ， 如 代码 清单 5-3 所 示 。 


代码 清单 5-3 ”静态 内 部 类 示例 





public class Outer { 
private static int shared = 100 
public static class StaticInner { 
public void innerMethod(){ 
System.out.println("inner " + shared); 


} 


public void test(){ 
StaticInner si = new StaticInner(); 
si.innerMethod(); 
} 
} 





外 部 类 为 Outer， 静 态 内 部 类 为 StaticInner， 带 有 static 修 饰 符 。 语 法 
上 ， 静 态 内 部 类 除了 位 置 放 在 其 他 类 内 部 外 ， 它 与 一 个 独立 的 类 差别 不 
大 ， 可 以 有 静态 变量 、 静 态 方法 、 成 员 方 法 、 成 员 变 量 、 构 造 方法 等 。 


静态 内 部 类 与 外 部 类 的 联系 也 不 大 “与 其 他 内 部 类 相 比 ) 。 它 可 以 
访问 外 部 类 的 静态 变量 和 方法 ， 如 innerMethod 直 接 访问 shared 变 量 ， 但 
不 可 以 访问 实例 变量 和 方法 。 在 类 内 部 ， 可 以 直接 使 用 内 部 静态 类 ， 如 
test〈) 方法 所 示 。 


public 静 态 内 部 类 可 以 被 外 部 使 用 ， 只 是 需要 通过 “外 部 类 .静态 内 部 
类 ”的 方式 使 用 ， 如 下 所 示 : 























Outer.StaticInner si = new Outer.StaticInner(); 
si,.innerMethod(); 








静态 内 部 类 是 怎么 实现 的 呢 ? 代码 清单 5-3 所 示 的 代码 实际 上 会 生 
成 两 个 类 : 一 个 是 Outer， 另 一 个 是 Outer$StaticInner， 人 代码 大 概 如 代码 
清单 5-4 所 示 。 


代码 清单 5-4 静态 内 部 类 示例 的 内 部 实现 





public class Outer { 


private static int shared = 100 

public void test(){ 
Outer$StaticInner si = new Outers$staticInner(); 
si.innerMethod(); 

} 

static int access$0(){ 
return shared; 

} 

} 


public class Outer$StaticInner { 
public void innerMethod() { 
System,.out.printJln("inner ”+ Outer.access$0()); 
} 


} 





内 部 类 访问 了 外 部 类 的 一 个 私有 静态 变量 shared， 而 我 们 知道 私有 
变量 是 不 能 被 类 外 部 访问 的 ，Java 的 解决 方法 是 : 目 动 为 Outer 生 成 一 个 
非 私有 访问 方法 access$0， 它 返回 这 个 私有 静态 变量 shared。 


静态 内 部 类 的 使 用 场景 是 很 多 的 ， 如 果 它 与 外 部 类 关系 密切 ， 且 不 
依赖 于 外 部 类 实例 ， 则 可 以 考虑 定义 为 静态 内 部 类 。 比 如 ， 一 个 类 内 
部 ， 如 果 既 要 计算 最 大 值 ， 义 要 计算 最 小 值 ， 可 以 在 一 次 过 历 中 将 最 大 
值 和 最 小 值 都 计算 出 来 ， 但 怎么 返回 呢 ? 可 以 定义 一 个 类 Pair， 包 括 最 
大 值 和 最 小 值 ， 但 Pair 这 个 名 字 太 普 届 ， 而 且 它 主要 是 类 内 部 使 用 的 ， 
就 可 以 定义 为 一 个 静态 内 部 类 。 


我 们 也 可 以 看 一 些 在 Java API 中 使 用 静态 内 部 类 的 例子 : 


0 内 部 有 一 个 私有 静态 内 部 类 IntegerCache， 用 于 支持 整数 
的 自动 装 箱 


.表示 链表 的 LinkedList 类 内 部 有 一 个 私有 静态 内 部 类 Node， 表 示 链 
表 中 的 每 个 节点 。 


.Character 类 内 部 有 一 个 public 静 态 内 部 类 UnicodeBlock， 用 于 表示 
一 个 Unicode block。 


以 上 一 些 类 的 细节 我 们 在 后 续 章 市 会 再 介绍 。 




















5.3.2 成 员 内 部 类 


与 静态 内 部 类 相 比 ， 成 员 内 部 类 没有 static 修 饰 符 ， 少 了 一 个 static 





修饰 符 ， 含 义 有 很 大 不 同 ， 下 面 我 们 详细 讨论 。 我 们 看 个 成 员 内 部 类 的 
例子 ， 如 代码 清单 5-5 所 示 。 


代码 清单 5-5 成 员 内 部 类 示例 





public class Outer { 
private int a = 100; 
public class Inner { 
public void innerMethod(){ 
System.out.printin("outer a " +a); 
Outer .this.action( ); 
} 
} 
private void action(){ 
System.out.printiln("action"); 
} 


public void test(){ 
Inner inner = new Inner(); 
inner.innerMethod( ) ; 
} 
} 








Inner 就 是 成 员 内 部 类 ， 与 静态 内 部 类 不 同 ， 除 了 静态 变量 和 方法 ， 
成 员 内 部 类 还 可 以 直接 访问 外 部 类 的 实例 变量 和 方法 ， 如 innerMethod 直 
接 访 问 外 部 类 私有 实例 变量 a。 成 员 内 部 类 还 可 以 通过 “外 部 
类 .this.xxx” 的 方式 引用 外 部 类 的 实例 变量 和 方法 ， 如 
Outer.this.action 〈) ， 这 种 写法 一 般 在 重 名 的 情况 下 使 用 ， 如 果 没 有 重 
名 ， 那 么 “外 部 类 .this.” 是 多 余 的 。 


在 外 部 类 内 ， 使 用 成 员 内 部 类 与 静态 内 部 类 是 一 样 的 ， 直 接 使 用 即 
可 ， 如 test() 方法 所 示 。 与 静态 内 部 类 不 同 ， 成 员 内 部 类 对 象 总 是 与 
一 个 外 部 类 对 象 相连 的 ， 在 外 部 使 用 时 ， 它 不 能 直接 通过 new 
Outer.Inner 〈) 的 方式 创建 对 象 ， 而 是 要 先 将 创建 一 个 Outer 类 对 象 ， 代 
码 如 下 所 示 : 




















Outer outer = new Outer(); 
Outer.Inner inner = outer.new Inner(); 
inner.innerMethod( ); 





创建 内 部 类 对 象 的 语法 是 “外 部 类 对 象 .new 内 部 类 《〈《) ”， 如 


outer.new Inner () 。 


与 静态 内 部 类 不 同 ， 成 员 内 部 类 中 不 可 以 定义 静态 变量 和 方法 








(final 变 量 例 外 ， 它 等 同 于 第 量 ) ， 下 面 介 绍 的 方法 内 部 类 和 匿名 内 部 
类 也 都 不 可 以 。Java 为 什么 要 有 这 个 规定 呢 ? 可 以 这 么 理解 ， 这 些 内 部 
类 是 与 外 部 实例 相连 的 ， 不 应 独立 使 用 ， 而 静态 变量 和 方法 作为 类 型 的 
属性 和 方法 ， 一 般 是 独立 使 用 的 ， 在 内 部 类 中 意义 不 大 ， 而 如 果 内 部 类 
确实 需要 静态 变量 和 方法 ， 那 么 也 可 以 挪 到 外 部 类 中 。 


成 员 内 部 类 背后 是 怎么 实现 的 呢 ? 代码 清单 5-5 也 会 生成 两 个 类 ; 
一 个 是 Outer， 另 一 个 是 Outer$Inner， 它 们 的 代码 大 概 如 代码 清单 5-6 所 
示 5 











代码 清单 5-6 成 员 内 部 类 示例 的 内 部 实现 





public class Outer { 
private int a = 100; 
private void action() { 
System.out.printlin("action"); 


} 

public void test() { 
Outer$Inner inner = new Outer$Inner(this ) ; 
inner.innerMethod(); 


static int access$0(Outer outer) { 
return outer.a; 


static void access$1(Outer outer) { 
outer .action( ); 
} 


public class Outer$Inner { 
final Outer outer ; 
public Outer$Inner(Outer outer ){ 
ths.outer = Outer ， 


} 
public void innerMethod() { 
System,.out.println("outer a " + Outer.access$0(outer)); 
Outer.access$1(outer); 
} 
} 








Outer$Inner 类 有 个 实例 变量 outer 指 同 外 部 类 的 对 象 ， 它 在 构造 方法 
中 被 初始 化 ，Outer 在 新 建 Outer$Inner 对 象 时 给 它 传 递 当 前 对 象 ， 由 于 内 
部 类 访问 了 外 部 类 的 私有 变量 和 方法 ， 外 部 类 Outer 生 成 了 两 个 非 私 有 
静态 方法 : access$0 用 于 访问 变量 a，access$1 用 于 访问 方法 action。 


成 员 内 部 类 有 哪些 应 用 场景 呢 ? 如 有 果 内 部 类 与 外 部 类 关系 密切 ， 和 需 
要 访问 外 部 类 的 实例 变量 或 方法 ， 则 可 以 考虑 定义 为 成 员 内 部 类 。 外 部 
类 的 一 些 方法 的 返回 值 可 能 是 茶 个 接口 ， 为 了 返回 这 个 接口 ， 外 部 类 方 





法 可 能 使 用 内 部 类 实现 这 个 接口 ， 这 个 内 部 类 可 以 被 设 为 private， 对 外 
完全 隐藏 。 


比如 ， 在 Java API 的 类 LinkedList 中 ， 它 的 两 个 方法 listIterator 和 
descendingIterator 的 返回 值 都 是 接口 Iterator， 调 用 者 可 以 通过 Iterator 接 
口 对 链表 遍历 ，listIterator 和 descend-ingIterator 内 部 分 别 使 用 了 成 员 内 部 
类 ListItr 和 DescendingIterator， 这 两 个 内 部 类 都 实现 了 接口 Iterator。 关 于 
LinkedList， 第 9 章 会 详细 介绍 。 





5.3.3 ”方法 内 部 类 


本 一 个 方法 体 中 。 我 们 看 个 例子 ， 如 代码 清单 5- 
7Z 上 所 不 。 


代码 清单 5-7 方法 内 部 类 示例 





public class Outer { 
private int a = 100; 
public void test(final int param){ 
final String Str = "hel1o"， 
class Inner { 
public void innerMethod(){ 
System,out.printJln("outer a " +a); 
System.out.println("param " +param); 
System.out.printin("local var " +str); 


} 


Inner inner = new Inner(); 
inner.innerMethod( ); 





类 Inner 定 义 在 外 部 类 方法 test 中 ， 方 法 内 部 类 只 能 在 定义 的 方法 内 
被 使 用 。 如 果 方 法 是 实例 方法 ， 则 除了 静态 变量 和 方法 ， 内 部 类 还 可 以 
直接 访问 外 部 类 的 实例 变量 和 方法 ， 如 innerMethod 直 接 访 问 了 外 部 私有 
实例 变量 a。 如 果 方 法 是 静态 方法 ， 则 方法 内 部 类 只 能 访问 外 部 类 的 静 
态 变 量 和 方法 。 方 法 内 部 类 还 可 以 直接 访问 方法 的 参数 和 方法 中 的 局 部 
变量 ， 不 过 ， 这 些 变量 必须 被 声明 为 final， 如 innerMethod 直 接 访问 了 方 
法 参数 param 和 局 部 变量 str。 


方法 内 部 类 是 怎么 实现 的 呢 ? 对 于 代码 清单 5-7， 系 统 生成 的 两 个 























类 代码 大 概 如 代码 清单 5-8 所 示 。 
代码 清单 5-8 方法 内 部 类 示例 的 内 部 实现 





public class Outer { 
private int a = 100; 
public void test(final int param) { 
final String str = "hello"; 
OuterInner inner = new OuterInner(this, param); 
inner.innerMethod( ); 


static int access$o(Outer outer){ 
return outer.a; 
} 


} 
public class OuterInner { 
Outer outer; 
int param， 
OuterInner(Outer outer, int param)t 
this.outer = outer,; 
this.param = param; 


} 
public void innerMethod() { 
System.out.println("outer a " + Outer.access$0(this.outer)); 
System.out.println("param " + param); 
System.out.printin("local var " + "hello"); 
} 
} 





与 成 员 内 部 类 类 似 ，OuterInner 类 也 有 一 个 实例 变量 outer 指 向 外 部 
对 象 ， 在 构造 方法 中 被 初始 化 ， 对 外 部 私有 实例 变量 的 访问 也 是 通过 
Outer 添 加 的 方法 access$0 来 进行 的 。 


方法 内 部 类 可 以 访问 方法 中 的 参数 和 局 部 变量 ， 这 是 通过 在 构造 方 
法 中 传递 参数 来 实现 的 ， 如 OuterInner 构 造 方法 中 有 参数 int param， 在 新 
建 OuterInner 对 象 时 ，Outer 类 将 方法 中 的 参数 传递 给 了 内 部 类 ， 如 
OuterInner inner=new OuterInner (this，param) ; 。 在 上 面 的 代码 中 ， 
String str 并 没有 被 作为 参数 传递 ， 这 是 因为 它 被 定义 为 了 常量 ， 在 生成 
的 代码 中 ， 可 以 直接 使 用 它 的 值 。 


这 也 解释 了 为 什么 方法 内 部 类 访问 外 部 方法 中 的 参数 和 局 部 变量 
时 ， 这 些 变量 必须 被 声明 为 final， 因 为 实际 上 ， 方 法 内 部 类 操作 的 并 不 
古 外 部 的 变量 ， 而 是 它 自己 的 实例 变量 ， 只 是 这 些 变 量 的 值 和 外 部 一 
样 ， 对 这 些 变 量 赋值 ， 并 不 会 改变 外 部 的 值 ， 为 避免 混 清 ， 所 以 干脆 强 
制 规定 必须 声明 为 final。 

















如 果 的 确 需 要 修改 外 部 的 变量 ， 那 么 可 以 将 变量 改 为 只 会 该 变量 的 
数组 ， 修 改 数 组 中 的 值 ， 如 代码 清单 5-9 所 示 。 


代码 清单 5-9 方法 内 部 类 修改 外 部 变量 实例 








public class Outer { 
public void test(){ 
final String[] str = new String[]{"hello"}; 
class Inner { 
public void innerMethod(){ 
str[0] = "hello world"; 


} 

Inner inner = new Inner(); 
inner.innerMethod(); 
System.out.printin(str[0]); 








str 是 一 个 只 含 一 个 元 素 的 数组 ， 方 法 内 部 类 不 能 修改 str 本 里 ， 但 可 
以 修改 它 的 数组 元 素 。 


通过 前 面 介绍 的 语法 和 原理 可 以 看 出 ， 方 法 内 部 类 可 以 用 成 员 内 部 


类 代 蔡 ， 至 于 方法 参数 ， 也 可 以 作为 参数 传递 给 成 员 内 部 类 。 不 过 ， 如 
果 类 只 在 东 个 方法 内 被 使 用 ， 使 用 方法 内 部 类 ， 可 以 实现 更 好 的 封 效 。 


5.34 匿名 内 部 类 





与 前 面 介绍 的 内 部 类 不 同 ， 匿 名 内 部 类 没有 单独 的 类 定义 ， 它 在 创 
建 对 象 的 同时 定义 类 ， 语 法 如 下 : 





new 父 类 (参数 列表 ) { 
// 匿 名 内 部 类 实现 部 分 
} 

















{ 
// 匿 名 内 部 类 实现 部 分 














匿名 内 部 类 是 与 new 关 联 的 ， 在 创建 对 象 的 时 候 定 义 关 ，new 后 面 
是 父 类 或 者 父 接 口 ， 然 后 是 圆 括 号 () ， 里 面 可 以 是 传递 给 父 类 构造 方 
法 的 参数 ， 最 后 是 大 括号 {}， 里 面 是 类 的 定义 。 

看 个 具体 的 例子 ， 如 代码 清单 5-10 所 示 。 


代码 清单 5-10 匿名 内 部 类 示例 











public class Outer { 
public void test(final int x, final int y){ 
Point p = new Point(2,3){ 
Q@Override 
public double distance() 
return distance(new Point(x,y)); 


}; 
System.out.printin(p.distance( )); 








创建 Point 对 象 的 时 候 ， 定 义 了 一 个 匿名 内 部 类 ， 这 个 类 的 父 类 是 
Point， 创 建 对 象 的 时 候 ， 给 父 类 构造 方法 传递 了 参数 2 和 3， 重 写 了 
distance ( ) 方法 ， 在 方法 中 访问 了 外 部 方法 final 参 数 x 和 y。 


匿名 内 部 类 只 能 被 使 用 一 次 ， 用 来 创建 一 个 对 象 。 它 没有 名 字 ， 没 
有 构造 方法 ， 但 可 以 根据 参数 列表 ， 调 用 对 应 的 父 类 构造 方法 。 它 可 以 
定义 实例 变量 和 方法 ， 可 以 有 初始 化 代码 块 ， 初 始 化 代码 块 可 以 起 到 构 
造 方 法 的 作用 ， 只 是 构造 方法 可 以 有 多 个 ， 而 初始 化 代码 块 只 能 有 一 
份 。 因 为 没有 构造 方法 ， 它 自己 无 法 接受 参数 ， 如 果 必 须要 参数 ， 则 应 
该 使 用 其 他 内 部 类 。 与 方法 内 部 类 一 样 ， 匿 名 内 部 类 也 可 以 访问 外 部 类 
的 所 有 变量 和 方法 ， 可 以 访问 方法 中 的 final 参 数 和 局 部 变量 。 

匿名 内 部 类 是 怎么 实现 的 呢 ? 每 个 匿名 内 部 类 也 都 被 生成 为 一 个 独 
立 的 类 ， 只 是 类 的 名 字 以 外 部 类 加 数字 编写， 没有 有 意义 的 名 字 。 代 码 
清单 5-10 会 产生 两 个 类 Outer 和 Outer$1， 代 码 大 概 如 代码 清单 5-11 所 
人 No 


代码 清单 5-11 匿名 内 部 类 示例 的 内 部 实现 


























public class Outer { 
public void test(final int x, final int y){ 
Point p = new Outer$1(this,2,3,x,y); 


System.out.printin(p.distance()); 
} 


} 
public class Outer$1 extends Point { 
int x2; 
int y2; 
Outer outer; 
Outer$1(Outer outer, int xi1, int yl1, int x2, int y2){ 
super (x1,y1); 
this.outer = outer,; 
this.x2 = x2; 
this.y2 = y2; 


Q@override 


public double distance() { 
return distance(new Point(this.x2,y2)); 
} 


} 





与 方法 内 部 类 类 似 ， 外 部 实例 this、 方 法 参数 x 和 y 都 作为 参数 传递 
给 了 内 部 类 构造 方法 。 此 外 ，new 时 的 参数 2 和 3 也 传递 给 了 构造 方法 ， 
内 部 类 构造 方法 又 将 它们 传递 给 了 父 类 构造 方法 。 


匿名 内 部 类 能 做 的 ， 方 法 内 部 类 都 能 做 。 但 如 末 对 象 只 会 创建 一 
次 ， 且 不 需要 构造 方法 来 接受 参数 ， 则 可 以 使 用 匿名 内 部 类 ， 这 样 代码 
书写 上 更 为 简 滞 。 


在 调用 方法 时 ， 很 多 方法 需要 一 个 接口 参数 ， 比 如 Arrays.sort 方 
法 ， 它 可 以 接受 一 个 数组 ， 以 及 一 个 Comparator 接 口 参 数 ，Comparator 
有 一 个 方法 compare 用 于 比较 两 个 对 象 。 比 如 ， 要 对 一 个 字符 串 数 组 不 
区 分 大 小 写 排 序 ， 可 以 使 用 Arrays.sort 方 法 ， 但 需要 传递 一 个 实现 了 
Comparator 接 口 的 对 象 ， 这 时 就 可 以 使 用 匿名 内 部 类 ， 代 码 如 下 所 示 : 











public void sortIgnoreCase(String[] strs)t{ 
Arrays.sort(strs, new Comparator<String>() { 
@Override 
public int compare(String o1, String 02) { 
return oi1.compareToIgnoreCase(o2); 
} 
}); 
} 








Comparator 后 面 的 <String> 与 泛 型 有 关 ， 表 示 比 较 的 对 象 是 字符 串 
类 型 。 匿 名 内 部 类 还 经 常用 于 事件 处 理 程序 中 ， 用 于 响应 某 个 事件 ， 比 
如 一 个 Button， 处 理 单 击 事件 的 代码 可 能 类 似 如 下 : 





Button bt = new Button(); 
bt.addActionListener(new ActionListener(){ 
Q@Override 
public void actionPerformed(ActionEvent e) { 
/处 理事 件 


























调用 addActionListener 将 事件 处 理 程 序 注册 到 了 Button 对 象 bt 中 ， 当 
事件 发 生 时 ， 会 调用 actionPerformed 方 法 ， 并 传递 事件 详情 ActionEvent 
作为 参数 。 


以 上 Arrays.sort 和 Button 都 是 针对 接口 编程 的 例子 ， 另 外 ， 它 们 也 都 
是 一 种 回调 的 例子 。 所 谓 回 调 是 相对 于 一 般 的 正 同 调用 而 言 的 ， 平 时 
一 般 都 是 正 回 调用， 但 Arrays.sort 中 传递 的 Comparator 对 象 ， 它 的 
compare 方 法 并 不 是 在 写 代 码 的 时 候 被 调用 的 ， 而 是 在 Arrays.sort 的 内 部 
某 个 地 方 回 过 头 来 调用 的 。Button 的 addActionListener 中 传递 的 
ActionListener 对 象 ， 它 的 actionPerformed 方 法 也 一 样 ， 是 在 事件 发 生 的 
时 候 回 过 头 来 调用 的 。 


将 程序 分 为 保持 不 变 的 主体 框架 ， 和 针对 具体 情况 的 可 变 逻 辑 ， 通 
过 回调 的 方式 进行 协作 ， 是 计算 机 程序 的 一 种 常用 实践 。 匿 名 内 部 类 是 
实现 回调 接口 的 一 种 简便 方式 。 


至 此 ， 关 于 各 种 内 部 类 就 介绍 完了 。 内 部 类 本 质 上 都 会 被 转换 为 独 
立 的 闫 ， 但 一 般 而 言 ， 它 们 可 以 实现 更 好 的 封闭， 代码 实现 上 也 更 为 简 


;6 。 











5.4 枚 举 的 本 质 


本 节 探 讨 Java 中 的 枚 举 类 型 。 枚 举 是 一 种 特殊 的 数据 ， 它 的 取 值 是 
有 限 的 ， 是 可 以 枚 举 出 来 的 ， 比 如 一 年 有 四 季 、 一 周 有 七 天 。 人 
类 也 可 以 处 理 这 种 数据 ， 但 枚 举 类 型 更 为 简洁 、 安 全 和 方便 。 下 面 介 
枚 举 的 使 用 和 实现 原理 。 先 介绍 基础 用 法 和 原理 ， 再 介绍 典型 场景 。 





5.4.1 ”基础 


定义 和 使 用 基本 的 枚 举 是 比较 简单 的 ， 我 们 来 看 个 例子 。 为 表示 衣 
ee 我 们 定义 一 个 枚 举 类 型 Size， 包 括 三 个 尺寸 ; 小 、 中 、 大 ， 
尺码 如 下 : 


public enum Size { 
SMALL, ET LARGE 


枚 举 使 用 enum 这 个 关键 字 来 定义 ，Size 包 括 三 个 值 ， 分 别 表示 小 、 
中 、 大 ， 值 一 般 是 大 写 的 字母 ， 多 个 值 之 间 以 逗号 分 隔 。 枚 举 关 型 可 以 
定义 为 一 个 单独 的 文件 ， 也 可 以 定义 在 其 他 类 内 部 。 


可 以 这 样 使 用 Size: 











Size size = Size.MEDIUM 





Size size 声 明了 一 个 变量 size， 它 的 类 型 是 Size，size=Size.MEDIUM 
将 枚 举 值 MEDIUM 赋 值 给 size 变 量 。 枚 举 变 量 的 toString 方 法 返回 其 字面 
值 ， 所 有 枚 举 类 型 也 都 有 一 个 name() 方法 ， 返 回 值 与 toString () 一 
样 ， 例 如 : 





Size size = Size.SMALL,; 
System.out.println(size.tostring()); 
System,out.println(Size,name())， 


输出 都 是 SMALL 。 枚 举 变量 可 以 使 用 equals 和 == 进 行 比较 ， 结 果 是 
一 样 的 ， 例 如 : 





Size size = Size.SMALL,; 
System,.out.println(size==Size.SMALL); 
System.out.println(size.equals(Size.SMALL)); 
System,.out.println(size==Size .MEDIUM); 





上 面 代码 的 输出 结果 为 三 行 ， 分 别 是 true、true、false。 枚 举 值 是 有 
顺序 的 ， 可 以 比较 大 小 。 枚 举 类 型 都 有 一 个 方法 int ordinal () ， 表 示 枚 
举 值 在 声明 时 的 顺序 ， 从 0 开始 ， 例 如 ， 如 下 代码 输出 为 1: 








Size size = Size.MEDIUM 
System.out.println(size.ordinal()); 





另外 ， 枚 举 类 型 都 实现 了 Java API 中 的 Comparable 接 口 ， 都 可 以 通 
过 方法 compareTo 与 其 他 枚 举 值 进行 比较 。 比 较 其 实 就 是 比较 ordinal 的 
大 小 ， 例 如 ， 如 下 代码 输出 为 -1， 表 示 SMALL 小 于 MEDIUM: 








Size size = Size.SMALL,; 
System,out.println(Size,compareTo(Size.MEDIUM) ) ， 





枚 举 变量 可 以 用 于 和 其 他 类 型 变量 一 样 的 地 方 ， 如 方法 参数 、 关 变 
量 、 实 例 变量 等 。 枚 举 还 可 以 用 于 switch 语 句 ， 代 码 如 下 所 示 : 











static void onChosen(Size size){ 

switch(size)f{ 
case SMALL: 

System.out.printJln("chosen small"); break ; 
case MEDIUM : 

System,out.printJln("chosen medium"); break 
case LARGE : 

System.out.println("chosen large"); break ; 
} 


} 





在 switch 语 句 内 部 ， 枚 举 值 不 能 带 枚 举 类 型 前 级 ， 例 如 ， 直 接 使 用 
SMALL， 不 能 使 用 Size.SMALL。 枚 举 类 型 都 有 一 个 静态 的 
valueOf (String) 方法 ， 可 以 返回 字符 串 对 应 的 枚 举 值 ， 例 如 ， 以 下 代 
码 输 出 为 true: 


System.out.println(Size.SMALL==Size.valueof("SMALL")); 





枚 举 类 型 也 都 有 一 个 静态 的 values 方 法 ， 返 回 一 个 包括 所 有 枚 举 值 
的 数组 ， 顺 序 与 声明 时 的 顺序 一 致 ， 例 如 : 








for(Size Size : Size.values()){ 
System.out.printiln(size); 


} 





屏幕 输出 为 三 行 ， 分别 是 SMALL、MEDIUM、LARGE。 


Java 是 从 Java 5 才 开 始 文 持 枚 举 的 ， 在 此 之 前 ， 一 般 是 在 类 中 定义 
静态 整 型 变量 来 实现 类 似 功能 ， 代 码 如 下 所 示 : 








class Size { 
public static final int SMALL = 0; 
public static final int MEDIUM = 1; 
public static final int LARGE = 2， 
} 








枚 举 的 好 处 体现 在 以 下 几 方 面 。 
定义 枚 举 的 语法 更 为 简 尘 。 


枚 举 更 为 安全 。 一 个 枚 举 类 型 的 变量 ， 它 的 值 要 么 为 null， 要 么 为 
枚 举 值 之 一 ， 不 可 能 为 其 他 值 ， 但 使 用 整 型 变量 ， 它 的 值 束 没有 办 法 强 
制 ， 值 可 能 就 是 无 效 的 。 


- 枚 举 类 型 自 带 很 多 便利 方法 (如 values、valueOf、toString 等 〉， 
易于 使 用 。 


枚 举 是 怎么 实现 的 呢 ? 枚 举 类 型 实际 上 会 被 Java 编 译 器 转换 为 一 个 
对 应 的 类 ， 这 个 类 继承 了 Java API 中 的 java.lang.Enum 类 。Enum 类 有 
name 和 ordinal 两 个 实例 变量 ， 在 构造 方法 中 需要 传递 ，name () 、 
toString () 、ordinal () 、compareTo () 、equals() 方法 都 是 由 
Enum 类 根据 其 实例 变量 name 和 ordinal 实 现 的 。values 和 valueOf 方 法 是 编 
译 器 给 每 个 枚 举 类 型 自动 添加 的 ， 上 面 的 枚 举 类 型 Size 转 换 成 的 普通 类 
的 代码 大 概 如 代码 清单 5-12 所 示 。 需 要 说 明 的 是 ， 这 只 是 示意 代码 ， 不 














能 直接 运行 。 
代码 清单 5-12” 枚 举 类 Size 对 应 的 普通 类 示意 代码 











public final class Size extends Enum<Size> { 
public static final Size SMALL = new Size("SMALL",0); 
public static final Size MEDIUM = new Size("MEDIUM",1); 
public static final Size LARGE = new Size("LARGE",2); 
private static Size[] VALUES = new Size[]{SMALL,MEDIUM,LARGE}; 
private Size(String name, int ordinal){ 
super(name, ordinal); 


public static Size[] values(){ 
Size[] values = new Size[VALUES.1length]; 
System.arraycopy(VALUES, ©0, values, 0, VALUES.1length); 
return values,; 


public static Size Valueof(String name){ 
return Enum.valueOof(Size.class, name); 





解释 几 点 : 


1) Size 是 final 的 ， 不 能 被 继承 ，Enum<Size> 表 示 父 类 ，<Size> 是 泛 
型 写法 ; 


2) Size 有 一 个 私有 的 构造 方法 ， 接 受 name 和 ordinal， 传 递 给 父 
类 ， 私 有 表示 不 能 在 外 部 创建 新 的 实例 ; 


3) 三 个 枚 举 值 实际 上 是 三 个 静态 变量 ， 也 是 final 的 ， 不 能 被 修 
改 ; 


4) values 方 法 是 编译 器 添加 的 ， 内 部 有 一 个 values 数 组 保持 所 有 榴 
举 值 ; 


5) valueO 仿 法 调用 的 是 父 类 的 方法 ， 额 外 传递 了 参数 Size.class， 
表示 类 的 类 型 信息 ， 关于 类 型 信 妃 的 详细 介 绍 在 第 21 章 ， 父 类 实际 上 是 
回 过 头 来 调用 values 方 法 ， 根 据 name 对 比 得 到 对 站 应 的 枚 举 值 的 。 


一 般 枚 举 变 量 会 被 转换 为 对 应 的 类 变量 ， 在 switch 语 句 中 ， 枚 举 值 
会 被 转换 为 其 对 应 的 ordinal 值 。 可 以 看 出 ， 枚 举 类 型 本 质 上 也 是 类 ， 但 
由 于 编译 器 自动 做 了 很 多 事情 ， 因 此 它 的 使 用 更 为 简洁 、 安 全 和 方便 。 








5.4.2 ”典型 场景 


以 上 枚 举 用 法 是 最 简单 的 ， 实 际 中 枚 举 经 常会 有 关联 的 实例 变量 和 
方法 。 比 如 ， 上 面 的 Size 例 子 ， 每 个 枚 举 值 可 能 有 关联 的 缩写 和 中 文 名 
称 ， 可 能 需要 静态 方法 根据 缩写 返回 对 应 的 枚 举 值 ， 修 改 后 的 Size 代 码 
如 代码 清单 5-13 所 示 。 


代码 清单 5-13 ” 带 有 实例 变量 和 方法 的 枚 举 类 Size 











public enum Size { 

SMALL("S", "小 号 ")， 

MEDIUM( "M", "中 号 ")， 

LARGE("L", Ws 

private String abbr; 

private String title; 

private Size(String abbr, String title){ 
this.abbr = abbr; 
this.title = title; 


} 
public String getAbbr() { 
return abbr; 


public String getTitle() { 
return title; 
} 


public static Size fromAbbr(String abbr){ 
for(Size size : Size.values()) 
if(size.getAbbr().equals(abbr))t{ 
return size; 
} 


return null; 
} 
} 





上 述 代码 定义 了 两 个 实例 变量 abbr 和 title， 以 及 对 应 的 get 方 法 ， 分 
别 表 示 缩 写 和 中 文 名 称 ; 定义 了 一 个 私有 构造 方法 ， 接 受 缩写 和 中 文 名 
称 ， 每 个 枚 举 值 在 定义 的 时 候 都 传递 了 对 应 的 值 ， 同 时 定义 了 一 个 静态 
方法 fromAbbr， 根 据 缩写 返回 对 应 的 枚 举 值 。 需 要 说 明 的 是 ， 枚 举 值 的 
1 
能 写 其 他 代码 。 


这 个 枚 举 定义 的 使 用 与 其 他 类 类 似 ， 比 如 : 

















Size s = Size.MEDIUM,; 
System.out.println(s.getAbbr()); // 输 出 M 





s = Size.fromAbbr("L"); 
System.out.println(s.getTitle()); // 输 出 “大 号 ” 








加 了 实例 变量 和 方法 后 ， 枚 举 转换 后 的 类 与 代码 清单 5-12 类 似 ， 只 
是 增加 了 对 应 的 变量 和 方法 ， 修 改 了 构造 方法 ， 代 码 不 同 之 处 大 概 如 代 
码 清单 5-14 所 示 。 


代码 清单 5-14 增加 了 实例 变量 和 方法 后 的 枚 举 类 Size 对 应 的 普通 
类 示意 代码 





public final class Size extends Enum<Size> { 
public static final Size SMALL = new Size("SMALL",0, "S", "小 号 "); 
public static final Size MEDIUM = new Size("MEDIUM",14,"M", "中 号 "); 
public static final Size LARGE = new Size("LARGE",2,"L", "大 号 "); 
private String abbr; 
private String titile; 
private Size(String name, int ordinal, String abbr, String title)t{ 
super (name, ordinal); 
this.abbr = abbr; 
this.title = title; 
} 
// 其 他 代码 

















每 个 枚 举 值 经 常 有 一 个 关联 的 标识 符 (id) ， 通 常用 int 整 数 表示 ， 
使 用 整数 可 以 节约 存储 空间 ， 减 少 网 络 传输 。 一 个 自然 的 想法 是 使 用 枚 
举 中 自 带 的 ordinal 值 ， 但 ordinal 值 并 不 是 一 个 好 的 选择 。 为 什么 呢 ? 
为 ordinal 值 会 随 着 枚 举 值 在 定义 中 的 位 置 变化 而 变化 ， 但 一 般 来 说 ， 我 
们 和 希望 id 值 和 枚 举 值 的 关系 保持 不 变 ， 尤 其 是 表示 枚 举 值 的 id 已 经 保存 
在 了 很 多 地 方 的 时 候 。 比 如 ， 上 面 的 Size 例 子 ，Size.SMALL 的 ordinal 值 
为 0， 我 们 希望 0 表示 的 就 是 Size.SMALL， 但 如 果 增 加 一 个 表示 超 小 的 
值 XSMALL: 





public enum Size 
XSMALL, SMALL, MEDIUM, LARGE 








这 时 ，0 就 表示 XSMALL 了。 所 以 ， 一般 是 增加 一 个 实例 变量 表示 
0 id 可 以 自己 定义 。 比 如 ，Size 例 子 
可 以 写 为 : 








public enum Size { 
XSMALL(10), SMALL(20), MEDIUM(30), LARGE(40); 
private int id; 
private Size(int id){ 
this,id = id; 


} 
public int getId() { 
return id; 


枚 举 还 有 一 些 高 级 用 法 ， 比 如 ， 每 个 枚 举 值 可 以 有 关联 的 类 
体 ， 枚 举 类 型 可 以 声明 抽象 方法 ， 每 个 枚 举 值 中 可 以 实现 该 方法 节 可 
以 重 写 枚 举 类 型 的 其 他 方法 。 此 外 ， 枚 举 可 以 实现 接口 ， 也 可 以 在 接口 
中 定义 枚 举 ， 其 使 用 相对 较 少 ， 我 们 就 不 介绍 了 。 


人 至此， 关于 枚 举 ， 我 们 就 介绍 完了 ， 对 于 枚 举 类 型 的 数据 ， 虽 然 直 
接 使 用 类 也 可 以 处 理 ， 但 枚 举 类 型 更 为 简洁 、 安 全 和 方便 


本 章 介 绍 了 类 的 一 些 扩展 概念 ， 包 括 接口 、 抽 象 类 、 内 部 类 和 枚 
举 。 我 们 之 前 提 到 过 寞 常 ， 但 并 未 深入 讨论 ， 让 我 们 下 一 半 来 探讨 。 


第 6 章 。” 异 党 


之 前 我 们 介绍 的 基本 类 型 、 类 、 接 口 、 枚 举 都 是 在 表示 和 操作 数 
据 ， 操 作 的 过 程 中 可 能 有 很 多 出 错 的 情况 ， 出 错 的 原因 可 能 是 多 方面 
的 ， 有 的 是 不 可 控 的 内 部 原因 ， 比 如 内 存 不 够 了 、 磁 盘 满 了 ， 有 的 是 不 
可 控 的 外 部 原因 ， 比 如 网 络 连接 有 问题 ， 更 多 的 可 能 是 程序 的 编写 错 
误 ， 比 如 引用 变量 未 初始 化 就 直接 调用 实例 方法 。 


这 些 非 正 帝 情况 在 Java 中 统一 被 认为 是 民 毅 ，Java 使 用 异 间 机 制 来 
统一 处 理 。 本 章 就 来 详细 讨论 Java 中 的 异常 机 制 ， 首 先 介绍 异 第 的 初步 
概念 ， 以 及 寞 第 类 本 里 ， 然 后 主要 介绍 异常 的 处 理 。 











6.1 初 识 异 各 


我 们 先 来 看 两 个 具体 的 异常 :NullPointerException 和 
NumberFormatException 。 


6.1.1 NullPointerException( 空 指针 异常 ) 


我 们 来 看 段 代 码 : 





public class ExceptionTest { 
public static void main(String[] args) { 
String s = null; 
s.indexof("a"); 
System.out.printin("end"); 
} 
} 





变量 s 没 有 初始 化 就 调用 其 实例 方法 indexOf， 运 行 ， 屏 戎 输出 为 : 





Exception in thread "main" java.lang.NullPointerException 
at ExceptionTest.main(ExceptionTest.java:5) 





输出 是 告诉 我 们 : 在 ExceptionTest 类 的 main 函 数 中 ， 代 码 第 5 行 ， 
出 现 了 空 指针 异常 (java.lang.NullPointerException) 。 


但 ， 具 体 发 生 了 什么 昵 ?” 当 执行 s.indexOf ("a") 的 时 候 ，Java 虚 拟 
机 发 现 s 的 值 为 null， 没 有 办 法 继续 执行 了 ， 这 时 就 启用 异 稼 处 理 机 制 ， 
首先 创建 一 个 异常 对 象 ， 这 里 是 类 NullPointerException 的 对 象 ， 然 后 查 
找 看 谁 能 处 理 这 个 异常 ， 在 示例 代码 中 ， 没 有 代码 能 处 理 这 个 异常， 
此 Java 局 用 默认 处 理 机 制 ， 即 打印 异常 栈 信 息 到 屏幕 ， 并 退出 程序 。 
在 介绍 函数 调用 原理 的 时 候 ， 我 们 介绍 过 栈 ， 异 常 栈 信息 就 包括 了 
从 异常 发 生 点 到 最 上 层 调 用 者 的 轨迹 ， 还 包括 行 号 ， 可 以 说 ， 这 个 栈 信 
是 分 析 异 常 最 为 重要 的 信息 。 


Java 的 默认 腊 常 处 理 机 制 是 退出 程序 ， 异 第 发 生 点 后 的 代码 都 不 会 





Pn 


执行 ， 所 以 示例 代码 中 的 System.out.printtn ("end") 不 会 执行 。 
6.1.2 NumberFormatException 〈 数 字 格 式 异 常 ) 


我 们 再 来 看 一 个 例子 ， 代 码 如 下 : 





public class ExceptionTest { 
public static void main(String[] args) { 
if(args.length<1){ 
System.out.println(" 请 输入 数字 ")，; 
return; 


int num = Integer.parseInt(args[0]); 
System.out.printlin(num); 





args 表 示 命 令 行 参数 ， 这 上 段 代 码 要 求 参数 为 一 个 数字 ， 它 通过 
Integer.parseInt 将 参数 转换 为 一 个 整数 ， 并 输出 这 个 整数 。 人 参数 是 用 户 
输入 的 ， 我 们 没有 办 法 强制 用 户 输入 什么 ， 如 果 用 户 输入 的 是 数字 ， 比 
如 123， 屏 莫 会 输出 123， 但 如 果 用 户 输 的 不 是 数字 而 是 字母 ， 比 如 
abc， 屏 幕 会 输出 : 











Exception in thread "main" java.lang.NumberFormatException: For Input string: "abc" 
at java.lang.NumberFormatException.forInputSstring(NumberFormatException.java:65, 
at java.lang.Integer.parseInt(Integer.java:492) 
at java.lang.Integer.parseInt(Integer.java:527) 
at ExceptionTest.main(ExceptionTest.java:7) 








出 现 了 异常 NumberFormatException。 这 个 异常 是 怎么 产生 的 呢 ? 
根据 异常 栈 信 息 ， 我 们 看 相关 代码 。NumberFormatException 类 65 行 附 
近代 码 如 下 : 





64 static NumberFormatException forInputString(String s) { 
65 return new NumberFormatException("For input string: \"" + S+ "\""); 
66 } 





Integer 类 492 行 附近 代码 如 下 : 





490 digit = Character.digit(s.charAt(i++),radix); 


491 if (digit < 6) { 


492 throw NumberFormatException.forInputString(s); 
493 } 

494 if (result < multmin) { 

495 throw NumberFormatException.forInputString(s); 
496 } 





将 这 两 处 合 为 一 行 ， 主 要 代码 就 古 : 





throw new NumberFormatException(...) 





new NumberFormatException 是 容易 理解 的 ， 含 义 是 创建 了 一 个 类 的 
对 象 ， 只 是 这 个 类 是 一 个 异常 类 。throw 是 什么 意思 呢 ? 就 是 抛 出 异 
和 常 ， 它 会 触发 Java 的 异常 处 理 机 制 。 在 之 前 的 空 指针 异常 中 ， 我 们 没有 
看 到 throw 的 代码 ， 可 以 认为 throw 是 由 Java 虚 拟 机 自己 实现 的 。 


throw 关 键 字 可 以 与 return 关 键 字 进行 对 比 。retum 代 表 正 党 退出， 
throw 代 表 异 常 退 出 ;return 的 返回 位 置 是 确定 的 ， 就 是 上 一 级 调用 者 ， 
而 throw 后 执行 哪 行 代码 则 经 营 是 不 确定 的 ， 由 异常 处 理 机 制 动 态 确 
定 。 





异常 处 理 机 制 会 从 当前 函数 开始 查找 看 谁 “捕获 ”了 这 个 寞 常 ， 当 前 
函数 没有 就 但 看 上 一 层 ， 和 下 到 主 函 数 ， 如 琳 主 冰 数 也 没有 ， 束 使 用 默认 
机 制 ， 即 输出 异常 栈 信息 并 退出 ， 这 正 是 我 们 在 屏 磊 输出 中 看 到 的 。 

对 于 屏 融 输出 中 的 异常 栈 信息 ， 程 序 员 是 可 以 理解 的 ， 但 普通 用 户 
无 法 理解 ， 也 不 知道 该 怎么 办 ， 我 们 需要 给 用 户 一 个 更 为 友好 的 信息 ， 
告诉 用 户 ， 他 应 该 输入 的 是 数字 ， 要 做 到 这 一 点 ， 需 要 自己 “捕获 ” 异 
常 。“ 捕 获 ” 是 指使 用 try/catch 关 键 字 ， 如 代码 清单 6-1 所 示 。 


代码 清单 6-1 捕获 异常 示 例 代码 














public class ExceptionTest { 
public static void main(String[] args) { 
if(args.1length<1){ 
System.out.println(" 请 输入 数字 ")， 
return; 


} 
try{ 
int num = Integer.parseIint(args[0]); 
System.out.printin(num); 
}catch(NumberFormatException e){ 








System,err.println(" 参 数 " + args[9] + "不 是 有 效 的 数字 ， 请 输入 数字 " ) ; 


上 述 代 码 使 用 try/catch 捕 获 并 处 理 了 异常 ，try 后 面 的 花 括 写 {} 内 包 
含 可 能 抛 出 异常 的 代码 ， 插 号 后 的 catch 语 句 包 含 能 捕获 的 异常 和 人 处理 代 
码 ，catch 后 面 括号 内 是 异常 信息 ， 包 括 异 常 类 型 和 变量 名 ， 这 里 是 
NumberFormatException e， 通 过 它 可 以 获取 更 多 异 名 信息 ， 人 花 括号 全 内 
是 处 理 代码 ， 这 里 输出 了 一 个 更 为 友好 的 提示 信息 。 


捕获 寞 第 后 ， 程 序 束 不 会 异常 退出 了 ， 但 try 语 句 内 异常 点 之 后 的 其 
他 代码 就 不 会 执行 了 ， 执 行 完 catch 内 的 语句 后 ， 程 序 会 继续 执行 catch 
化 括号 外 的 代码 。 


至 此 ， 我 们 束 对 寞 党 有 了 一 个 初步 的 了 解 。 寞 常 是 相对 于 return 的 
一 种 退出 机 制 ， 可 以 由 系统 触 有 发， 也 可 以 由 程序 通过 throw 语 句 触发 ， 
异常 可 以 通过 try/catch 语 句 进 行 捕获 并 处 理 ， 如 果 没 有 捕获 ， 则 会 导致 
程序 退出 并 输出 异种 栈 信息 。 腊 凋 有 不 同 的 类 型 ， 接 下 来 ， 我 们 来 认识 
= 

















6.2 ”异常 类 


NullPointerException 和 NumberFormatException 都 是 异常 类 ， 所 有 蜡 
常 类 都 有 一 个 共同 的 父 类 Throwable， 我 们 先 来 介绍 这 个 父 类 ， 然 后 介 
绍 Java 中 的 异常 类 体系 ， 最 后 介绍 怎么 上 自 定 义 异 常 。 





6.2.1 Throwable 


NullPointerException 和 NumberFormatException 有 一 个 共同 的 父 类 
Throwable， 它 有 4 个 public 构 造 方法 : 





public Throwable() 

public Throwable(String message) 

public Throwable(String message, Throwable cause) 
public Throwable(Throwable cause) 


ODPp 








Throwable 类 有 两 个 主要 参数 : 一 个 是 message， 表 示 异 常 消息 男 
一 个 是 cause， 表 示人 触发 该 异常 的 其 他 异常 。 异 常 可 以 形成 一 个 异常 
链 ， 上 层 的 异常 由 底层 异常 触发 ，cause 表 示 底 层 异常 。Throwable 还 有 
一 个 public 方 法 用 于 设置 cause: 





Throwable initCause(Throwable cause) 








Throwable 的 某 些 子 类 没有 带 cause 参 数 的 构造 方法 ， 就 可 以 通过 这 
个 方法 来 设置 ， 这 个 方法 最 多 只 能 被 调用 一 次 。 在 所 有 构造 方法 的 内 
部 ， 都 有 一 句 重 要 的 函数 调用 : 











fillInstackTrace( ); 








它 会 将 异常 栈 信 息 保存 下 来 ， 这 是 我 们 能 看 到 异常 栈 的 关键 。 
Throwable 有 一 些 常用 方法 用 于 获取 寞 第 信息 ， 比 如 : 











void printStackTrace() // 打 印 异常 栈 信息 到 标准 错误 输出 流 
// 打 印 栈 信息 到 指定 的 流 ，PrintStream 和 Printwriter 在 第 13 章 介绍 

















void printStackTrace(PrintStream s) 

void printStackTrace(Printwriter s) 

String getMessage() // 获 取 设 置 的 异常 message 

Throwable getCause() // 获 取 异 常 的 cause 

// 获 取 异 常 栈 每 一 层 的 信息 ， 每 个 StackTraceElement 包 括 文件 名 、 类 名 、 函 数 名 、 行 号 等 信息 
StackTraceElement[] getStackTrace() 























6.2.2 ”异常 类 体系 


以 Throwable 为 根 ，Java 定 义 了 非常 多 的 异常 类 ， 表 示 各 种 类 型 的 异 
常 ， 部 分 类 如 图 6-1 所 示 。 


Throwable 








IIIegalStateException 
ClassCastException 


Virtual MachineError 





SQLException 


NumberFormatException 
图 6-1 Java 异 常 类 体系 
Throwable 是 所 有 异常 的 基 类 ， 它 有 两 个 子 类 : Error 和 Exception。 


Error 表 示 系 统 错误 或 资源 耗 尽 ， 由 Java 系 统 自 己 使 用 ， 应 用 程序 不 
应 抛 出 和 处 理 ， 比 如 图 6-1 中 列 出 的 虚拟 机 错误 〈VirtualMacheError) 及 
其 子 类 内 存 溢出 错误 〈OutOfMemory-Error) 和 栈 溢出 错误 

(StackOverflowError) 。 


Exception 表 示 应 用 程序 错误 ， 它 有 很 多 子 类 ， 应 用 程序 也 可 以 通过 
继承 Exception 或 其 子 类 创建 自 定义 异常 ， 图 6-1 中 列 出 了 三 个 直接 子 
类 : IOException 输入 输出 W/O 异常 )、RuntimeException (运行 时 异 
常 ) 、SQLException (数据 库 SQL 异 常 )。 


























OutOfMemoryError 


StackOverflowError 




















RuntimeException 比 较 特殊 ， 它 的 名 字 有 点 误导 ， 因 为 其 他 异常 也 
是 运行 时 产生 的 ， 它 表示 的 实际 含义 是 未 受 检 异 冲 (unchecked 
exception) ， 相 对 而 言 ，Exception 的 其 他 子 类 和 Exception 上 自身 则 是 受 检 
异常 (checked exception) ，Error 及 其 子 类 也 是 未 受 检 异 浓 。 


受 检 (checked) 和 未 受 检 (unchecked) 的 区 别 在 于 Java 如 何 处 理 
这 两 种 异 笛 。 对 于 受 检 蜡 常 ，Java 会 强制 要 求 程 序 员 进行 处 理 ， 人 否则 会 
有 编译 错误 ， 而 对 于 未 受 检 异 稼 则 没有 这 个 要 求 。 下 文 我 们 会 进一步 解 
释 。 

RuntimeException 也 有 很 多 子 类 ， 表 6-1 列 出 了 其 中 常见 的 一 些 。 


表 6-1 常见 的 RuntimeException 

















异 常 说 明 
NullPointerException 空 指针 异常 NumberFormatException 数字 格式 错误 
IllegalStateException 非法 状态 IndexOutOfBoundsException 索引 越界 
ClassCastException 非法 强制 类 型 转换 ArrayIndexOutOfBoundsException | 数组 索引 越界 
IllegalAreumentException 参数 错误 StringIndexOutOfBoundsException | 字符 串 索 引 越界 








如 此 多 不 同 的 异常 类 其 实 并 没有 比 Throwable 这 个 基 类 多 多 少 属 性 
和 方法 ， 大 部 分 类 在 继承 父 类 后 只 是 定义 了 几 个 构造 方法 ， 这 些 构造 方 
法 也 只 是 调用 了 父 类 的 构造 方法 ， 并 没有 额外 的 操作 。 


那 为 什么 定义 这 么 多 不 同 的 类 呢 ? 主要 是 为 了 名 字 不 同 。 有 异常 类 的 
名 字 本 映 就 代表 了 弄 常 的 关键 信息 ， 无 论 是 抛 出 还 是 捕获 异常 ， 使 用 合 
适 的 名 字 都 有 助 于 代码 的 可 读 性 和 可 维护 性 。 














6.2.3” 自 定义 异常 





除了 Java API 中 定义 的 异常 类 ， 也 可 以 自己 定义 异常 类 ， 一 般 是 继 
承 Exception 或 者 它 的 某 个 子 类 。 如 果 父 类 是 RuntimeException 或 它 的 某 
个 子 类 ， 则 上 自 定 义 异 常 也 是 未 受 检 腊 常 ， 如 果 是 Exception 或 Exception 的 
其 他 子 类 ， 则 自 定义 异常 是 受 检 异 常 。 


我 们 通过 继承 Exception 来 定义 一 个 异常 ， 如 代码 清单 6-2 所 示 。 











代码 清单 6-2 ” 自 定 义 寞 常 示例 





public class AppException extends Exception { 
public AppException() { 
super(); 


public AppException(String message, Throwable cause) { 
super (message, cause); 


} 
public AppException(String message) { 
super (message); 


} 
public AppException(Throwable cause) { 
super (cause); 





和 很 多 其 他 腊 常 类 一 样 ， 我 们 没有 定义 额外 的 属性 和 代码 ， 只 是 继 
承 了 Exception， 定 义 了 构造 方法 并 调用 了 父 类 的 构造 方法 。 


6.3 ”异常 处 理 


在 了 解 了 异常 的 基本 概念 和 异常 类 之 后 ， 我 们 来 看 Java 语 言 对 弄 生 
处 理 的 支持 ， 包 括 catch、throw、finally、try-with-resources 和 throws， 最 
后 对 比 受 检 和 未 受 检 异常 。 





6.3.1 ”catch[L 配 


在 代码 清单 6-1 中 ， 我 们 简单 演示 了 使 用 try/catch 捕 获 异 常 ， 其 中 
catch 只 有 一 条 ， 其 实 ，catch 还 可 以 有 多 条 ， 每 条 对 应 一 种 异常 类 型 。 
示例 如 下 面 代码 所 示 : 

















try{ 
// 可 能 触发 异常 的 代码 
}catch(NumberFormatException e){ 

System.out.printlin("not valid number"); 
}catch(RuntimeException e){ 

System.out.println("runtime exception "+e.getMessage()); 
}catch(Exception e){ 

e,.printStackTrace( ); 


} 





异种 处 理 机 制 将 根据 抛 出 的 异 营 类 型 找 第 一 个 匹配 的 catch 块 ， 找 到 
后 ， 执 行 catch 块 内 的 代码 ， 不 再 执行 其 他 catch 块 ， 如 果 没 有 找到 ， 会 
继续 到 上 层 方法 中 但 找 。 需 要 注意 的 是 ， 抛 出 的 异常 类 型 是 catch 中 声明 
异常 的 子 类 也 算 罗 配 ， 所 以 需要 将 最 具体 的 子 类 放 在 前 面 ， 如 果 基 类 
Exception 放 在 前 面 ， 则 其 他 更 具体 的 catch 代 码 将 得 不 到 执行 。 


上 述 示例 也 演示 了 对 异常 信息 的 利用 ，e.getMessage〈() 获取 异常 
消息 ，e.printStackTrace () 打印 异常 栈 到 标准 错误 输出 流 。 这 些 信息 有 
助 于 理解 为 什么 会 出 现 异 常 ， 这 是 解决 编程 错误 的 常用 方法 。 示 例 是 直 
us 到 标准 流 上 ， 实 际 系统 中 更 常用 的 做 法 是 输出 到 专门 的 日 


在 示例 中 ， 每 种 寞 党 类 型 部 有 单独 的 catch 语 句 ， 如 果 多 种 寞 党 处 理 
的 代码 是 类 似 的 ， 这 种 写法 比较 烦琐 。 目 Java 7 开始 支持 一 种 新 的 语 
法 ， 多 个 寞 第 之 间 可 以 用 “操作 符 ， 形 如 : 














try { 





// 可 能 抛 出 ExceptionA 和 ExceptionB 
} catch (ExceptionA | ExceptionB e) { 
e.printSstackTrace(); 





6.3.2 ”重新 抛 出 异 季 





在 catch 块 内 处 理 完 后 ， 可 以 重新 抛 出 异常 ， 腊 种 可 以 是 原来 的 ， 也 
可 以 是 新 建 的 ， 如 下 所 示 : 





try{ 
// 可 能 触发 异常 的 代码 
}catch(NumberFormatException e){ 
System.out.printiln("not valid number"); 
throw new AppException(" 输 入 格式 不 正确 "，e); 
}catch(Exception e){ 
e.printStackTrace( ); 
throw e; 


} 








对 于 Exception， 在 打印 出 噶 弟 栈 后 ， 就 通过 throw e 重 新 抛 出 了 。 


而 对 于 NumberFormatException， 重 新 抛 出 了 一 个 AppException， 当 
前 Exception 作 为 cause 传 递 给 了 AppException， 这 样 就 形成 了 一 个 异常 
链 ， 捕 获 到 AppException 的 代码 可 以 通过 getCause 〈) 得 到 
NumberFormatException 。 


为 什么 要 重新 抛 出 呢 ? 因为 当前 代码 不 能 够 完全 处 理 该 异 毅 ， 需 
调用 者 进一步 处 理 。 


为 什么 要 抛 出 一 个 新 的 异常 呢 ? 当然 是 因为 当前 异常 不 太 合 适 。 不 
合适 可 能 是 信息 不 够 ， 需 要 补充 一 些 新 信息 ; 还 可 能 是 过 于 细节 ， 不 便 
于 调用 者 理解 和 使 用 ， 如 果 调 用 者 对 细 市 感 兴趣 ， 还 可 以 继续 通过 
getCause《〈) 获取 到 原始 异常 。 


烟 


pA 








6.3.3 finally 


寞 单机 制 中 还 有 一 个 重要 的 部 分 ， 就 是 finally。catch 后 面 可 以 跟 


finally 语 句 ， 语 法 如 下 所 示 : 





try{ 
// 可 能 抛 出 异常 

}catch(Exception e){ 
// 捕 获 异 常 

}finally{ 
// 不 管 


} 





























有 无 异常 都 执行 














finally 内 的 代码 不 管 有 无 异 币 发 生 ， 都 会 执行 ， 具 体 来 说 : 
如果 没 有 异常 发 生 ， 在 try 内 的 代码 执行 结束 后 执行 。 
如果 有 异常 及 生 且 被 catch 捕 获 ， 在 catch 内 的 代码 执行 结束 后 执 
行 。 
如果 有 异 津 发生 但 没 被 捕获 ， 则 在 异常 彼 抛 给 上 层 之 前 执行 。 
,由 于 finally 的 这 个 特 后 ， 它 一 般 用 于 释放 资源 ， 如 数据 库 连接 、 文 
流 等 。 


try/catch/finally 语 法 中 ，catch 不 是 必需 的 ， 也 束 是 可 以 只 有 
try/finally， 表 示 不 捕获 异常 ， 寞 第 自动 向 上 传递 ， 但 finally 中 的 代码 在 
寞 第 发 生 后 也 执行 。 


finally 语 句 有 一 个 执行 细节 ， 如 果 在 try 或 者 catch 语 句 内 有 return 语 
人 句 ， 则 return 语 句 在 finally 语 句 执 行 结束 后 才 执 行 ， 但 finally 并 不 能 改变 
返回 值 ， 我 们 来 看 下 面 的 代码 : 














public static int test(){ 
int ret = 0; 
try{ 
return ret; 
}finally{ 
ret = 2; 
} 
} 











这 个 函数 的 返回 值 是 0(， 而 不 是 2。 实 际 执行 过 程 是 ; 在 执行 到 try 内 
的 return ret; 语句 前 ， 会 先 将 返回 值 ret 保 存在 一 个 临时 变量 中 ， 然 后 才 


执行 fnally 语 句 ， 最 后 try 再 返回 那个 临时 变量 ，finally 中 对 ret 的 修改 不 
会 被 返回 。 


如 果 在 finally 中 也 有 retum 语 句 呢 ?try 和 catch 内 的 return 会 丢失 ， 实 
际会 返回 finally 中 的 返回 值 。finally 中 有 retum 不 仅 会 覆盖 try 和 catch 内 的 
返回 值 ， 还 会 掩盖 try 和 catch 内 的 异 稼 ， 就 像 异 名 没有 发 生 一 样 ， 比 
如 : 








public static int test(){ 
int ret = 0; 
try{ 
int a = 5/0; 
return ret; 
}finally{ 
return 2; 
} 


} 





以 上 代码 中 ，5/0 会 触发 ArithmeticException， 但 是 finally 中 有 return 
语句 ， 这 个 方法 就 会 运 回 2， 而 不 再 铅 上 传递 异常 了 。finally 中 ， 如 果 
finally 中 抛 出 了 异常 ， 则 原 异常 也 会 被 掩盖 ， 看 下 面 的 代码 : 





public static void test(){ 
try{ 
int a = 5/0; 
}finally{ 
throw new RuntimeException("hello"),; 
} 


} 





finally 中 抛 出 了 RuntimeException， 则 原 异 各 ArithmeticException 就 
丢失 了 。 所 以 ， 一 般 而 言 ， 为 避免 混 消 ， 应 该 避免 在 finally 中 使 用 retum 
语句 或 者 抛 出 异常 ， 如 果 调 用 的 其 他 代码 可 能 抛 出 异常 ， 则 应 该 捕获 异 
第 并 进行 处 理 。 


6.3.4 try-with-resources 
对 于 一 些 使 用 资源 的 场景 ， 比 如 文件 和 数据 库 连接 ， 典 型 的 使 用 流 


程 是 首先 打开 资源 ， 最 后 在 finally 语 句 中 调用 资源 的 关闭 方法 ， 针 对 这 
种 场景 ，Java 7 开始 文 持 一 种 新 的 语法 ， 称 之 为 try-with-resources， 这 种 


语法 针对 实现 了 java.lang.AutoCloseable 接 口 的 对 象 ， 该 接口 的 定义 为 : 





public interface AutoCloseable { 
void close() throws Exception; 


} 





没有 try-with-resources 时 ， 使 用 形式 如 下 : 





public static void useResource() throws Exception { 
AutoCloseable r = new FileInputStream("hello"); // 创 建 资源 
try { 
// 使 用 资源 
} finally { 
r.close(); 








使 用 try-with-resources 语 法 ， 形 式 如 下 : 





public static void useResource() throws Exception { 
try(AutoCloseable r = new FileInputStream("hello")) { // 创 建 资源 
// 使 用 资源 


ww 





资源 f 的 声明 和 初始 化 放 在 try 语 句 内 ， 不 用 再 调用 finally， 在 语句 执 
行 完 try 语 句 后 ， 会 自动 调用 资源 的 close() 方法 。 


资源 可 以 定义 多 个 ， 以 分 号 分 隔 。 在 Java 9 之 前 ， 资 源 必须 声明 和 
初始 化 在 try 语 句 块 内 ，Java 9 去 除了 这 个 限制 ， 资 源 可 以 在 try 语 句 外 被 
声明 和 初始 化 ， 但 必须 是 final 的 或 者 是 事实 上 final 的 《〈 即 虽然 没有 声明 
为 final 但 也 没有 被 重新 赋值 ) 。 


6.3.5 throws 


异常 机 制 中 ， 还 有 一 个 和 throw 很 像 的 关键 字 throws， 用 于 声明 一 个 
方法 可 能 抛 出 的 异常 ， 语 法 如 下 所 示 : 





public void test() throws AppException, 
SQLException, NumberFormatException { 


// 主 体 代码 








throws 跟 在 方法 的 括号 后 面 ， 可 以 声明 多 个 异常 ， 以 运 呈 分隔。 这 
个 声明 的 含义 是 ， 这 个 方法 内 可 能 抛 出 这 些 异 常 ， 且 没有 对 这 些 异 常 进 
行 处 理 ， 人 至少 没有 处 理 完 ， 调 用 者 必须 进行 处 理 。 这 个 声明 没有 说 明 具 
体 什 么 情况 会 殷 出 什么 异常 ， 作 为 一 个 民 好 的 实践 ， 应 该 将 这 些 信 息 用 
注释 的 方式 进行 说 明 ， 这 样 调 用 者 才能 更 好 地 人 处理 异 常 。 


对 于 未 受 检 异 常 ， 是 不 要 求 使 用 throws 进 行 声明 的 ， 但 对 于 受 检 异 
常 ， 则 必须 进行 声明 ， 换 句 话 说 ， 如 末 没 有 声明 ， 则 不 能 抛 出 。 


对 于 受 检 异 毅 ， 不 可 以 抛 出 而 不 声明 ， 但 可 以 声明 抛 出 但 实际 不 抛 
出 。 这 主要 用 于 在 父 类 方法 中 声明 ， 父 类 方法 内 可 能 没有 抛 出 ， 但 子 类 
重 写 方法 后 可 能 就 抛 出 了 ， 子 类 不 能 抛 出 父 类 方法 中 没有 声明 的 受 检 有 
常 ， 所 以 就 将 所 有 可 能 抛 出 的 异常 都 写 到 父 类 上 了 了 。 


如 果 一 个 方法 内 调用 了 男 一 个 声明 抛 出 受 检 异 第 的 方法 ， 则 必须 处 
理 这 些 受 检 有 异常 ， 处 理 的 方式 既 可 以 是 catch， 也 可 以 是 继续 使 用 
throws， 如 下 所 示 : 











public void tester() throws AppException { 
try { 
test(); 
} catch(SQLException e) { 
e.printSstackTrace(); 
} 


} 





对 于 test 抛 出 的 SQLException， 这 里 使 用 了 catch， 而 对 于 
AppException， 则 将 其 添加 到 了 自己 方法 的 throws 语 句 中 ， 表 示 当 前 方 
法 处 理 不 了 ， 继 续 由 上 层 处 理 。 


6.3.6 ”对 比 受 检 和 未 受 检 异 党 
通过 以 上 介绍 可 以 看 出 ， 未 受 检 异 常 和 受 检 异 和 常 的 区 别 如 下 : 受 检 


异 徊 必须 出 现在 了 hrows 语 句 中 ， 调用 者 必须 处 理 ，Java 编 译 器 会 强制 这 
一 点 ， 而 未 受 检 异 和 常 则 没有 这 个 要 求 。 





为 什么 要 有 这 个 区 分 呢 ? 我 们 自己 定义 异常 的 时 候 应 该 使 用 受 检 还 
是 未 受 检 异常 呢 ? 对 于 这 个 问题 ， 业 界 有 各 种 各 样 的 观点 和 争论 ， 没 有 
特别 一 致 的 结论 。 


一 种 普 衣 的 说 法 是 :未 受 检 寞 第 表 示 编 程 的 迎 辑 错误 ， 编 程 时 应 该 
检查 以 避免 这 些 错 误 ， 比 如 空 指 针 腊 常 ， 如 果真 的 出 现 了 这 些 寞 第 ， 程 
序 退 出 也 是 正常 的 ， 程 序 员 应 该 检查 程序 代码 的 bug 而 不 是 想 办 法 处 理 
这 种 异常 。 受 检 腊 种 表示 程序 本 身 没 问 题 ， 但 由 于 IO、 网 络 、 数 据 库 
等 其 他 不 可 预测 的 错误 导致 的 异 肖 ， 调 用 者 应 该 进行 适当 处理 。 


但 其 实 编程 错误 也 是 应 该 进行 处 理 的 ， 尤 其 是 Java 被 广泛 应 用 于 服 
务 絮 程序 中 ， 不 能 因为 一 个 逻辑 错误 就 使 程序 退出 。 所 以 ， 目 前 一 种 更 
被 认同 的 观点 是 Java 中 对 受 检 异 常 和 未 受 检 寞 第 的 区 分 是 没有 太 大 意 
义 的 ， 可 以 统一 使 用 未 受 检 有 异 着 来 代 答 。 


这 种 观点 的 基本 理由 是 : 无 论 是 受 检 有 异 稼 还 是 未 受 检 异 芝 ， 无 论 是 
个 出 现在 throws 声 明 中 ， 都 应 该 在 合适 的 地 方 以 适当 的 方式 进行 处 理 ， 
而 不 只 是 为 了 满足 编译 器 的 要 求 盲 目 处 理 异常 ， 既 然 都 要 进行 处 理 异 
人 
J 情 枕 下 。 


其 实 观 点 本 号 并 不 太 重 要 ， 更 重要 的 是 一 致 性 ， 一 个 项 目 中 ， 应 该 
对 如 何 使 用 噶 间 达成 一 致 ， 并 按照 约定 使 用 。 























6.4 如 何 使 用 卉 种 


针对 异常 ， 我 们 介绍 了 trywcatchy/finally、catch 匹 配 、 重 新 抛 出 、 
throws、 受 检 / 未 受 检 异常 ， 那 到 底 该 如 何 使 用 异常 呢 ? 下 面 从 异常 的 适 
用 情况 、 异 常 处 理 的 目标 和 一 般 逻 辑 等 多 个 角度 进行 介绍 。 











6.4.1 异常 应 该 且 仅 用 于 异常 情况 





异常 应 该 且 仪 用 于 异常 情况 ， 是 指 腊 第 不 能 代 蔡 正常 的 条 件 判 断 。 
比如 ， 循 环 处 理 数组 元 素 的 时 候 ， 应 该 先 检查 索引 是 否 有 效 再 进行 处 
理 ， 而 不 是 等 着 抛 出 索引 异常 再 结束 循环 。 对 于 一 个 引用 变量 ， 如 果 正 
常情 况 下 它 的 值 也 可 能 为 hol， 那 就 应 该 先 检查 是 不 是 null， 不 为 null 的 
情况 下 再 进行 调用 。 


男 一 方面 ， 真 正 出 现 异 常 的 时 候 ， 应 该 殷 出 异常 ， 而 不 是 返回 特殊 
值 。 比如，String 的 substring《〈) 方法 返回 一 个 子 字 符 串 ， 如 代码 清单 6- 
3 所 示 。 











代码 清单 6-3 String 的 substring () 方法 





public String substring(int beginIndex) { 
if(beginIndex < 0) { 
throw new StringIndexOutOfBoundsException(beginIndex); 
} 
int subLen = value.length - beginIndex; 
if(subLen < 0) { 
throw new StringIndexOutOfBoundsException(subLen); 


} 
return(beginIndex == 0) ? this : new String(value, beginIndex, subLen); 





代码 会 检查 beginIndex 的 有 效 性 ， 如 果 无 效 ， 会 抛 出 
StringIndexOutOfBoundsExcep-tion 异 常 。 纯 技术 上 一 种 可 能 的 替代 方法 
是 不 抛 出 异常 而 返回 特殊 值 null， 但 beginIndex 无 效 是 异常 情况 ， 异 常 不 
能 作为 正常 处 理 。 


6.4.2 ”异常 处 理 的 目标 


异 闸 大 概 可 以 分 为 三 种 来 源 ， 用 户 、 和 程序 员 、 第 三 方 。 用 户 是 指 用 
户 的 输入 有 问题 ， 程序 员 是 指 编程 错误 ;第 三 方 泛 指 其 他 情况 ， 如 IO 
错误 、 网 络 、 数 据 库 、 第 三 方 服务 等 。 每 种 寞 第 都 应 该 进行 适当 的 处 
理 。 








处 理 的 目标 可 以 分 为 恢复 和 报告 。 恢复 是 指 通 过 程序 自动 解决 问 
题 。 报 告 的 最 终 对 象 可 能 是 用 户 ， 即 程序 使 用 者 ， 也 可 能 是 系统 运 维 人 
员 或 程序 员 。 报 告 的 目的 也 是 为 了 恢复 ， 但 这 个 恢复 经 闻 需 要 人 的 参 











对 用 户 ， 如 果 用 户 输入 不 对 ， 可 以 提示 用 户 具 体 哪 里 输入 不 对 ， 如 
末 是 编程 错误 ， 可 以 提示 用 户 系统 错误 、 建 议 联系 客服 ， 如 果 是 第 三 方 
连接 问题 ， 可 以 提示 用 户 稍 后 重 试 。 


”对 系统 运 维和 人 员 或 程序 员 ， 他 们 一 般 不 关心 用 户 输 入 错误 ， 而 关注 
编程 错误 或 第 三 方 错 误 ， 对 于 这 些 错 误 ， 需 要 报告 尽量 完整 的 细节 ， 包 
括 异 第 链 、 寞 第 栈 等 ， 以 便 尽快 定位 和 解决 问题 。 


用 户 输 入 或 编程 错误 一 般 部 是 难以 通过 程序 自动 解决 的 ， 第 三 方 错 
误 则 可 能 可 以 ， 甚 至 很 多 时 候 ， 程 序 都 不 应 该 假定 第 三 方 是 可 靠 的 ， 应 
该 有 容错 机 制 。 比 如 ， 茶 个 第 三 方 服 务 连 接 不 上 《比如 发 短信 ) ， 可 能 
的 容错 机 制 是 换 男 一 个 提供 同样 功能 的 第 三 方 试 试 ， 还 可 能 是 间隔 一 段 
时 间 进 行 重 试 ， 在 多 次 失败 之 后 再 报告 错误 。 

















6.4.3 ”异常 处 理 的 一 般 逻 辑 


如 果 自 己 知道 怎么 处 理 异 常 ， 就 进行 处 理 ， 如 果 可 以 通过 程序 自动 
解决 ， 就 自动 解决 ， 如 果 异 常 可 以 被 自己 解决 ， 就 不 需要 再 同上 报告 。 


如 果 上 自己 不 能 完全 解决 ， 就 应 该 同上 报告 。 如 果 目 己 有 额外 信息 可 
以 提供 ， 有 助 于 分 析 和 解决 问题 ， 就 应 该 提供 ， 可 以 以 原 异 闻 为 cause 
重新 抛 出 一 个 开锅。 


总 有 一 层 代 人 码 需 要 为 异常 负责 ， 可 能 是 知道 如 何 处 理 该 腊 第 的 代 
码 ， 可 能 是 面 对 用 户 的 代码 ， 也 可 能 是 主 程序 。 如 果 异 第 不 能 自动 解 
决 ， 对 于 用 户 ， 应 该 根据 异常 信息 提供 用 户 能 理解 和 对 用 户 有 帮助 的 信 
恩 ; 对 运 维 和 开发 人 员 ， 则 应 该 输出 详细 的 异常 链 和 有 寞 第 栈 到 日 志 。 











这 个 逻辑 与 在 公司 中 人 处理 问题 的 逻辑 是 类 似 的 ， 每 个 级 别 都 有 自己 
应 该 解决 的 问题 ， 目 己 能 处 理 的 目 己 处 理 ， 不 能 处 理 的 就 应 该 报告 上 
级 ， 把 下 级 告诉 他 的 和 他 自己 知道 的 一 并 告诉 上 级 ， 最 终 ， 公 司 老 板 必 
| 
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本 章 介 绍 了 Java 中 的 异常 机 制 。 在 没有 异常 机 制 的 情况 下 ， 唯 一 的 
退出 机 制 是 returmn， 判 断 是 人 否 异种 的 方法 就 是 返回 值 。 方 法 根据 是 否 异 
常 返回 不 同 的 返回 值 ， 调 用 者 根据 不 同 返回 值 进行 判 新 ， 并 进行 相应 处 
理 。 每 一 层 方法 都 需要 对 调用 的 方法 的 每 个 不 同 返回 值 进 行 检 查 和 处 
理 ， 程 序 的 正常 逻辑 和 腊 党 逻辑 混杂 在 一 起 ， 代 码 往往 难以 阅读 理解 和 
维护 。 男 外 ， 因 为 异常 毕 况 是 少数 情况 ， 程 序 员 经 常 偷懒， 假装 异常 不 
会 及 生 ， 而 忽略 对 异常 返回 值 的 检查 ， 降 低 了 程序 的 可 靠 性 。 


在 有 了 有 异 帝 机制 后 ， 程 序 的 正常 逻辑 与 卉 常 巡 辑 可 以 相 分 离 ， 异 名 
情况 可 以 集中 进行 处 理 ， 腊 党 还 可 以 目 动 癌 上 传递 ， 不 再 需要 每 层 方法 
都 进行 处 理 ， 异 第 也 不 再 可 能 被 自动 忽略 ， 从 而 ， 处 理 异 常情 况 的 代码 
可 以 大 大 减少 ， 代 码 的 可 读 性 、 可 靠 性 、 可 维护 性 也 都 可 以 得 到 提高 。 


至 此 ， 关 于 Java 语 言 本 里 的 主要 松 念 我 们 束 介 绍 得 差不多 了 ， 下 一 
半 ， 我 们 介绍 一 些 和 常用 的 基础 类 。 





























第 7 章 ”常用 基础 类 


”本章 介绍 Java 编 程 中 一 些 常用 的 基础 类 ， 探 讨 它们 的 用 法 、 应 用 和 
实现 原理 ， 这 些 类 有 


各 种 包装 类 ，; 

:文本 处 理 的 类 String 和 StringBuilder; 
-数组 操作 的 类 Arrays; 

-日 期 和 时 间 处 理 ; 

随机 。 


7.1 季 装 类 








Java 有 8 种 基本 类 型 ， 每 种 基本 类 型 都 有 一 个 对 应 的 包 六 类 。 包 效 
类 是 什么 呢 ? 它 是 一 个 类 ， 内 部 有 一 个 实例 变量 ， 保 存 对 应 的 基本 类 型 
的 值 ， 这 个 类 一 般 还 有 一 些 静 态 方法 、 静 态 变 量 和 实例 方法 ， 以 方便 对 
数据 进行 操作 。Java 中 ， 基 本 类 型 和 对 应 的 包装 类 如 表 7-1 所 示 。 











表 7-1 ”基本 类 型 和 对 应 的 包装 类 


基本 类 型 包 装 类 
boolean Boolean Long 

byte Float 

short Short double Double 

int Integer Character 











包装 类 也 都 很 好 记 ， 除 了 Integer 和 Character 外 ， 其 他 类 名 称 与 基本 
类 型 基本 一 样 ， 只 是 首 字 和 母 大 写 。 包 装 类 有 什么 用 呢 ?Java 中 很 多 代码 
《比如 后 续 章 节 介 绍 的 容器 类 ) 只 能 操作 对 象 ， 为 了 能 操作 基本 类 型 ， 
需要 使 用 其 对 应 的 包装 类 。 男 外 ， 包 闭 类 提供 了 很 多 有 用 的 方法 ， 可 以 
方便 对 数据 的 操作 。 下 面 先 介绍 各 个 包装 类 的 基本 用 法 及 其 共同 点 ， 然 
后 重点 介绍 Integer 和 Character。 








7.11 大 本 用 法 


各 个 包装 类 都 可 以 与 其 对 应 的 基本 类 型 相互 转换 ， 方 法 也 是 类 似 
的 ， 部 分 类 型 如 表 7-2 所 示 。 


表 7-2 包装 类 与 基本 类 型 的 转换 


包装 类 与 基本 类 型 的 转换 示例 代码 装 类 与 基本 类 型 的 转换 示例 代码 
bl = false; 

Boolean | Boolean bObj = Boolean.valueOf(b]1); Double 
boolean b2 = bObj.booleanValue(); 


double dl] = 123.45; 

Double dOb]j = Double.valueOf(d1): 

double d2 = dObj.doubleValue(): 
int 11 = 12345; 

Integer Integer 1Obj = Integer.valueOf(11): 
int 12 = 10bj.IntValue(): 


char cl =)'A': 
Character | Character cObj = Character.valueOf(c1): 
char c2 = cObj.charValue(); 














包装 类 与 基本 类 型 的 转换 代码 结构 是 类 似 的 ， 每 种 包装 类 都 有 一 个 
静态 方法 valueOf () ， 接 受 基 本 类 型 ， 返 回 引 用 类 型 ， 也 都 有 一 个 实 
例 方 法 xxxValue () 返回 对 应 的 基本 类 型 。 


将 基本 类 型 转换 为 包 奢 类 的 过 程 ， 一 般 称 为 “ 装 箱 ”， 而 将 包 闭 类 型 
转换 为 基本 类 型 的 过 程 ， 则 称 为 " 拆 箱 ”。 闭 箱 / 拆 箱 写 起 来 比较 烦琐 ， 
Java5 以 后 引入 了 目 动 装 箱 和 拆 箱 技术 ， 可 以 直接 将 基本 类 型 赋值 给 引 
用 类 型 ， 反 之 亦 可 ， 比 如 : 








Integer a = 100 
int b = a; 





目 动 装 箱 / 拆 箱 是 Java 编 译 占 提供 的 能 力 ， 背 后 ， 它 会 蔡 换 为 调用 对 
应 的 valueOf/xxx-Value 方 法 ， 比 如 ， 上 面 的 代码 会 被 Java 编 译 器 蔡 换 
为 : 





Integer a = Integer,VvValueof(100) ， 
int b = a.intValue(); 





每 种 包装 类 也 都 有 构造 方法 ， 可 以 通过 new 创 建 ， 比 如 : 





Integer a = new Integer(100); 
Boolean b = new Boolean(true); 
Double d = new Double(12.345); 
Character c = new Character( ' 马 ' )) 





那 到 底 应 该 用 静态 的 valueOf 方 法 ， 还 是 使 用 new 呢 ?一般 建议 使 用 
ValueOf 方 法 。new 每 次 都 会 创建 一 个 新 对 象 ， 而 除了 Float 和 Double 外 的 
其 他 包装 类 ， 都 会 缓存 包装 类 对 象 ， 减 少 需要 创建 对 象 的 次 数 ， 节 省 空 
间 ， 提 升 性 能 。 实 际 上 ， 从 Java 9 开始 ， 这 些 构造 方法 已 经 被 标记 为 过 
时 了 ， 推 荐 使 用 静态 的 valueOf 方 法 。 


712 装 间 并 





各 个 包装 类 有 很 多 共同 点 ， 比 如 ， 都 重 写 了 Object 中 的 一 些 方法 ， 
都 实现 了 Comparable 接 口 ， 都 有 一 些 与 String 有 关 的 方法 ， 大 部 分 都 定 


义 了 一 些 静 态 常 量 ， 都 是 不 可 变 的 。 下 面具 体 介绍 。 
1. 重 写 Object 方 法 
所 有 包装 类 都 重 写 了 Object 类 的 如 下 方法 : 








boolean equals(Object obj ) 
int hashCode() 
String toString() 





我 们 分 别 介绍 。 
(1) equals 


equals 用 于 判断 当前 对 象 和 参数 传 入 的 对 象 是 否 相 同 ，Object 类 的 
默认 实现 是 比较 地 址 ， 对 于 两 个 变量 ， 只 有 这 两 个 变量 指 问 同一 个 对 象 
时 ，equals 才 返回 ttue， 它 和 比较 运算 符 (==) 的 结果 是 一 样 的 。 


equals 应 该 反映 的 是 对 象 间 的 逻辑 相等 关系 ， 所 以 这 个 默认 实现 一 
般 是 不 合适 的 ， 子 类 需要 重 写 该 实现 。 所 有 包装 类 都 重 写 了 该 实现 ， 实 
际 比较 用 的 是 其 包装 的 基本 类 型 值 ， 比 如 ， 对 于 Long 类 ， 其 equals 方 法 
代码 如 下 : 














public boolean equals(Object obj) { 
If(obj instanceof Long) { 
return value == ((Long)obj).1longVvalue(); 


return false; 


} 





对 于 Float， 其 实现 代码 如 下 : 





public boolean equals(Object obj) { 
return(obj instanceof Float) 
&& (floatToIntBits(((Float)obj).value) == floatToIntBits(value)); 
} 





Float 有 一 个 静态 方法 floatToIntBits () ， 将 float 的 二 进 制 表示 看 作 
int。 需 要 注意 的 是 ， 只 有 两 个 float 的 二 进 制 表示 完全 一 样 的 时 候 ， 








equals 才 会 返回 true。 在 2.2 节 的 时 候 ， 我 们 提 到 小 数 计算 是 不 精确 的 ， 
数学 概念 上 运算 结果 一 样 ， 但 计算 机 运算 结果 可 能 不 同 ， 比 如 下 面 的 代 
码 : 





Float f1 = 0.01f; 

Float f2 = 0.1f*0.1f; 
System,.out.println(f1i.equals(f2)); 
System,.out.println(Float.floatToInNtBits(f1)); 
System,.out.println(Float.floatToInNtBits(f2)); 





输出 为 : 





false 
1008981770 
1008981771 





也 就 是 ， 两 个 浮 点 数 不 一 样 ， 将 二 进 制 看 作 整 数 也 不 一 样 ， 相 差 为 


Double 的 equals 方 法 与 Float 类 似 ， 它 有 一 个 静态 方法 
doubleToLongBits， 将 double 的 二 进 制 表 示 看 作 long， 然 后 再 按 long 比 


a 
和 


父 
(2) hashCode 


hashCode 返 回 一 个 对 象 的 哈 希 值 。 哈 希 值 是 一 个 int 类 型 的 数 ， 由 对 
象 中 一 般 不 变 的 属性 映射 得 来 ， 用 于 快速 对 对 象 进行 区 分 、 分 组 等 。 一 
个 对 象 的 哈 希 值 不 能 改变 ， 相 同 对 象 的 哈 硕 值 必须 一 样 。 不 同 对 象 的 哈 
硕 值 一 般 应 不 同 ， 但 这 不 是 必需 的 ， 可 以 有 对 象 不 同 但 哈 希 值 相同 的 情 
况 。 


比如 ， 对 于 一 个 班 的 学 生 对 象 ，hashCode 可 以 是 学 生 的 出 生日 期 ， 
出 生日 期 是 不 变 的 ， 不 同学 生生 日 一 般 不 同 ， 分 布 比 较 均匀 ， 个 别 生 日 
相同 的 也 没关系 。 


hashCode 和 equals 方 法 联系 密切 ， 对 两 个 对 象 ， 如 果 equals 方 法 返回 
true， 则 hashCode 也 必须 一 样 。 反之 不 要 求 ，equal 方 法 返回 false 时 ， 
hashCode 可 以 一 样 ， 也 可 以 不 一 样 ， 但 应 该 尽量 不 一 样 。hashCode 的 默 
认 实 现 一 般 是 将 对 象 的 内 存 地 址 转换 为 整数 ， 子 类 如 果 重 写 了 equals 方 














法 ， 也 必须 重 写 hashCode。 之 所 以 有 这 个 规定 ， 是 因为 Java API 中 很 多 
类 依赖 于 这 个 行为 ， 尤 其 是 容器 中 的 一 些 类 。 


包装 类 都 重 写 了 hashCode， 根 据 包装 的 基本 类 型 值 计算 hashCode， 
对 于 Byte、Short、Integer、Character，hashCode 就 是 其 内 部 值 ， 代 码 
为 : 





public int hashCode() { 
return (int)value; 
} 





对 于 Boolean，hashCode 代 人 码 为 : 





public int hashcode() { 
return value ? 1231 : 1237; 
} 








根据 基 类 类 型 值 返 回 了 两 个 不 同 的 数 ， 为 什么 选 这 两 个 值 呢 ? 它们 
《 即 只 能 被 1 和 目 己 整除 的 数 ) ， 质 数 用 于 哈 希 时 比较 好 ， 不 容 
冲突 。 


对 于 Long，hashCode 代 码 为 : 





public int hashCode() { 
return(int)(value ^ (value >>> 32)); 
} 





是 高 32 位 与 低 32 位 进行 位 异 或 操作 。 


对 于 Float，hashCode 代 码 为 : 





public int hashCode() { 
return floatToIntBits(value),; 
} 





与 equals 方 法 类 似 ， 将 float 的 二 进 制 表 示 看 作 int。 
对 于 Double，hashCode 代 码 为 : 





public int hashCode() { 
long bits = doubleToLongBits(value); 
return(int)(bits ^ (bits >>> 32)); 

} 





与 edquals 方 法 类 似 ， 将 double 的 二 进 制 表 示 看 作 long， 然 后 再 按 long 
计算 hashCode。 


每 个 包装 类 也 都 重 写 了 了 toString 方法， 返回 对 象 的 字符 串 表 示 ， 这 
个 一 般 比 较 自 然 ， 不 再 歼 述 。 


2.Comparable 


每 个 包装 类 都 实现 了 Java API 中 的 Comparable 接 口 。Comparable 接 
口 代 码 如 下 : 





public interface Comparable<T> { 
public int compareTo(T 0); 
} 





<T> 是 泛 型 语法 ， 我 们 在 第 8 章 介 绍 ，T 表 示 比 较 的 类 型 ， 由 实现 接 
口 的 类 传 入 。 接 口上 只 有 一 个 方法 compareTo， 当 前 对 象 与 参数 对 象 进行 
比较 ， 在 小 于 、 等 于 、 大 于 参数 时 ， 应 分 别 返 回 -1、0、1。 


各 个 包装 类 的 实现 基本 都 是 根据 基本 类 型 值 进行 比较 ， 不 再 殉 述 。 
对 于 Boolean，false 小 于 true。 对 于 Float 和 Double， 存 在 和 equals 方 法 一 
样 的 问题 ，0.01 和 0.1*0.1 相 比 的 结果 并 不 为 0。 


3. 包 装 类 和 String 
除了 toString 方 法 外 ， 包 装 类 还 有 一 些 其 他 与 String 相 关 的 方法 。 除 


了 Character 外 ， 每 个 包装 类 都 有 一 个 静态 的 valueOf (String) 方法 ， 根 
据 字符 串 表 示 返 回 包 装 类 对 象 ， 如 : 

















Boolean b = Boolean.VvValueof("true")， 
Float f = Float.valueof("123.45f"); 





也 都 有 一 个 静态 的 parseXXX (String) 方法 ， 根 据 字 符 串 表示 返回 


基本 类 型 值 ， 如 : 





boolean b = Boolean.parseBoolean("true"); 
double d = Double.parseDouble("123.45"); 





都 有 一 个 静态 的 toString 方 法 ， 根 据 基 本 类 型 值 返回 字符 串 表 示 ， 
0: 





System.out.println(Boolean.toString(true)); 
System.out.println(Double.toString(123.45)); 











对 于 整数 类 型 ， 字 符 串 表示 除了 默认 的 十 进 制 外 ， 还 可 以 表示 为 其 
如 二 进 制 、 八 进 制 和 十 六 进 制 ， 包 装 类 有 静态 方法 进行 相互 转 
， 比 如 : 
































System,.out.println(Integer.toBinaryString(12345) ) ) // 输 出 二 进 制 
System.out ,println(Integer.toHexString(12345) )， // 输 出 十 六 进 制 
System.out.println(Integer.parseInt("3039", 16)); // 按 十 六 进 制 解析 








输出 : 





11000000111001 
3039 
12345 





4. 凶 用 和 党 量 


包装 类 中 除了 定义 静态 方法 和 实例 方法 外 ， 还 定义 了 一 些 静 态 变 
量 。 对 于 Boolean 类 型 ， 有 : 





public static final Boolean TRUE = new Boolean(true); 


public static final Boolean FALSE = new Boolean(false); 





所 有 数值 类 型 都 定义 了 MAX_ VALUE 和 MIN_VALUE， 表 示 能 表示 
的 最 大 /最 小 值 ， 比 如 ， 对 Integer: 





public static final int MIN_VALUE 
public static final int MAX_VALUE 


Ox80000000， 
QOx7fffffff,; 





Float 和 Double 还 定义 了 一 些 特殊 数值 ， 比 如 正 无 穷 、 负 无 穷 、 非 数 
值 ， 如 Double 类 : 





public static final double POSITIVE_INFINITY = 1.0 / 0.0; // 正 无 穷 
public static final double NEGATIVE_INFINITY = -1.0 / 0.0; // 负 无 穷 
public static final double NaN = 0.0d / 0.9; // 非 数值 





5.Number 


6 种 数值 类 型 包装 类 有 一 个 共同 的 父 类 Number。Number 是 一 个 抽象 
类 ， 它 定义 了 如 下 方法 : 





byte bytevalue() 
Short ShortValue() 
int intValue() 

long longValue() 
float floatvalue() 
double doubleVvalue() 








通过 这 些 方法 ， 包 装 类 实例 可 以 返回 任意 的 基本 数值 类 型 。 
6. 不 可 变性 


包装 类 都 是 不 可 变 类 。 所 谓 不 可 变 是 指 实例 对 象 一 旦 创建 ， 就 没有 
办 法 修改 了 。 这 是 通过 如 下 方式 强制 实现 的 : 


“所 有 包装 类 部 声明 为 了 final， 不 能 被 继承 。 
内 部 基本 类 型 值 是 私有 的 ， 且 声明 为 了 final。 





.没有 定义 setter 方 法 。 


为 什么 要 定义 为 不 可 变 类 了 呢 ? 不 可 变 使 得 程序 更 为 简单 安全 ， 因 
为 不 用 操心 数据 被 意外 改写 的 可 能 ， 可 以 安全 地 共 训 数据， 无 其 是 在 多 
线程 的 环境 下 。 关 于 线程 ， 我 们 在 第 15 章 介绍 。 








7.1.3 剖析 Integer 与 二 进 制 算法 


本 小 节 主 要 介绍 Integer 类 ，Long 与 Integer 类 似 ， 残 不 再 单独 介绍 
了 。 一 个 简单 的 Integer 还 有 什么 要 介绍 的 呢 ?” 它 有 一 些 二 进 制 操作 ， 包 
括 位 翻转 和 循环 移 位 等 ， 另 外 ， 我 们 也 分 析 一 下 它 的 valueOf 实 现 。 为 
什么 要 关心 实现 代码 呢 ? 大 部 分 情况 下 ， 确 实 不 用 关心 ， 会 用 它 就 可 以 
了 ， 我 们 主要 是 学 习 其 中 的 二 进 制 操作 。 二 进 制 是 计算 机 的 基础 ， 但 代 
码 往往 星 涩 难 懂 ， 我 们 希望 对 其 有 一 个 更 为 清晰 深刻 的 理解 。 


1. 位 翻转 
Integer 有 两 个 静态 方法 ， 可 以 按 位 进行 翻转 : 





public static int reverse(int 1i) 
public static int reverseBytes(int i) 





位 翻转 就 是 将 int 当 作 二 进 制 ， 左 边 的 位 与 右边 的 位 进行 互 换 ， 
reverse 是 按 位 进行 互 换 ，reverseBytes 是 按 byte 进 行 互 换 ， 我 们 来 看 个 例 
子 : 





int a = Ox12345678; 
System,out.println(Integer,toBinaryString(a) )， 
int r = Integer.reverse(a); 
System,out.println(Integer,toBinaryString(Cr) )， 
int rb = Integer.reverseBytes(a); 
System,out.println(Integer,toHexString(rb ) )， 





a 是 整数 ， 用 十 六 进 制 赋值 ， 首 先 输出 其 二 进 制 字符 串 ， 接 着 输出 
reverse 后 的 二 进 制 ， 最 后 输出 reverseBytes 后 的 十 六 进 制 ， 输 出 为 : 





10010001101000101011001111000 
11110011010100010110001001000 


78563412 





reverseBytes 是 按 字 节 翻 转 ，78 是 十 六 进 制 表示 的 一 个 字 节 ，12 也 
是 ， 所 以 结果 78563412 是 比较 容易 理解 的 。 二 进 制 翻转 初 看 是 不 对 的 ， 
这 是 因为 输出 不 是 32 位 ， 输 出 时 忽略 了 前 面 的 0， 我 们 补 齐 32 位 再 看 : 





00010010001101000101011001111000 
00011110011010100010110001001000 








这 次 结果 束 对 了 。 这 两 个 方法 是 怎么 实现 的 呢 ? 


先 来 看 reverseBytes 的 代码 : 





public static int reverseBytes(int i) { 
return ((i >>> 24) ) | 
((i >> 8) & 60xFF00) | 
((i << 8) & 90xFF0000) | 
((i << 24)); 





代码 比较 星 汲 ， 以 参数 等 于 0x12345678 为 例 ， 我 们 来 分 析 执 行 过 
程 : 

1) i>>>24 无 特写 石 移 ， 最 高 字 节 挪 到 最 低位 ， 结 琳 是 
0x00000012; 


2) (i>>8) &0xFF00， 左 边 第 二 个 字 节 挪 到 右边 第 二 个 ，i>>8 结 果 
是 0x00123456， 再 进行 &OxFF00， 保 留 的 是 右边 第 二 个 字 节 ， 结 果 是 
0x00003400; 


3) (i<<8) &0xFF0000， 右 边 第 二 个 字 节 挪 到 左边 第 二 个 ，i<<8 结 
果 是 0x34567800， 再 进行 &0xFF0000， 保 留 的 是 右边 第 三 个 字 节 ， 结 果 
是 0x00560000; 

4) i<<24， 结 果 是 0x78000000， 最 右 字 节 挪 到 最 左边 。 


这 4 个 结果 再 进行 或 操作 |， 结 果 就 是 0x78563412， 这 样 ， 通 过 左 
移 、 右 移 、 与 和 或 操作 ， 就 达到 了 字 节 翻转 的 目的 。 


我 们 再 来 看 reverse 的 代码 : 





public static int reverse(int i) { 
//HD, Figure 7-1 
i= (i& Ox55555555) << 1 | (i >>> 1) & 90x55555555 ， 


i = (i & 0x33333333) << 2 | (i >>> 2) & 0x33333333; 
i = (iiR&Oxofofofof)<< 4 | (i >>> 4) & 0xofofofof， 
i= (i << 24) | ((i & Oxff00) << 8) | 

((i >>> 8) & Oxff00) | (i >>> 24); 
return 工 ; 








这 段 代 码 昌 然 很 短 ， 但 非常 星 涩 ， 到 底 是 什么 意思 呢 ? 代 码 第 一 行 
是 一 个 注释 ，HD 表 示 的 是 一 本 书 ， 书 名 为 Hacker’s Delight， 中 文 版 为 
《算法 心得 :; 高 效 算法 的 奥秘 》，HD 是 它 的 缩写 ，Figure 7-1 是 书 中 的 
图 7-1，reverse 的 代码 就 是 复制 了 这 本 书 中 图 7-1 的 代码 ， 书 中 也 说 明了 
代码 的 思路 ， 我 们 简要 说 明 。 

高 效 实现 位 翻转 的 基本 思路 是 : 首先 交换 相 邻 的 单一 位 ， 然 后 以 两 
位 为 一 组 ， 再 交换 相 邻 的 位 ， 接 痢 是 4 位 一 组 交换 、 然 后 是 8 位 、16 位 ， 
16 位 之 后 就 完成 了 。 这 个 思路 不 仪 适用 于 二 进 制 ， 而 且 适 用 于 十 进 制 ， 
为 便于 理解 ， 我 们 看 个 十 进 制 的 例子 。 比 如 对 数字 12345678 进 行 翻转 。 


第 一 轮 ， 相 邻 单一 数字 进行 互 换 ， 结 末 为 : 





21 43 65 87 





第 二 轮 ， 以 两 个 数字 为 一 组 交换 相 邻 的 ， 结 果 为 : 





43 21 87 65 





第 三 轮 ， 以 4 个 数字 为 一 组 交换 相 邻 的 ， 结 果 为 : 





8765 4321 





翻转 完成 。 
对 十 进 制 而 言 ， 这 个 效率 并 不 高 ， 但 对 于 二 进 制 而 言 ， 却 是 高 效 











的 ， 因 为 二 进 制 可 以 在 一 条 指令 中 交换 多 个 相 邻 位 。 下 面 代 码 吏 是 对 
相 邻 单一 位 进行 互 换 : 





X = (x & Ox55555555) << 1 | (x & OxAAAAAAAA) >>> 1; 





5 的 二 进 制 表示 是 0101，0x55555555 的 二 进 制 表示 是 : 





01010101010101010101010101010101 








x&0x55555555 就 是 取 x 的 奇数 位 。 


A 的 二 进 制 表 示 是 1010，0xAAAAAAAA 的 二 进 制 表示 是 : 





10101010101010101010101010101010 





x&0xAAAAAAAA 就 是 取 x 的 偶数 位 。 





(Xx & Ox55555555) << 1 | (x & OxAAAAAAAA) >>> 1; 





表示 的 就 是 x 的 奇数 位 同 左 移 ， 侦 数位 向 右 移 ， 然 后 通过 | 合并 ， 达 
到 相 邻 位 互 换 的 目的 。 这 段 代码 可 以 有 个 小 的 优化 ， 只 使 用 一 个 常量 
0x55555555， 后 半 部 分 先 移 位 再 进行 与 操作 ， 变 为 : 





(i & QOx55555555) << 1 | (i >>> 1) & QOx55555555; 








同 理 ， 如 下 代码 就 是 以 两 位 为 一 组 ， 对 相 邻 位 进行 互 换 : 





i = (i & Ox33333333) << 2 | (i & QOxCCCCCCCC)>>>2; 





3 的 二 进 制 表 示 是 0011，0x33333333 的 二 进 制 表示 是 : 





00110011001100110011001100110011 





x&0x33333333 就 是 取 x 以 两 位 为 一 组 的 低 半 部 分 。 


C 的 二 进 制 表示 是 1100，0xCCCCCCCC 的 二 进 制 表 示 是 : 





11001100110011001100110011001100 





x&0xCCCCCCCC 就 是 取 x 以 两 位 为 一 组 的 高 半 部 分 。 





(i & Ox33333333) << 2 | (i & QOxCCCCCCCC)>>>2; 








表示 的 就 是 x 以 两 位 为 一 组 ， 低 半 部 分 癌 高 位 移 ， 高 半 部 分 向 低位 
移 ， 然 后 通过 | 合并 ， 达 到 交换 的 日 的 。 同 样 ， 可 以 去 掉 常 量 
0xCCCCCCCC， 代 码 可 以 优化 为 : 





(i & 0x33333333) << 2 | (i >>> 2) & 0x33333333; 








同 理 ， 下 面 代码 就 是 以 4 位 为 一 组 进行 交换 。 





i = (1I&Oxofofofof)<< 4 | (i >>> 4) & 0xofofofof， 








到 以 8 位 为 单位 交换 时 ， 就 是 字 节 翻转 了 ， 可 以 写 为 如 下 更 直接 的 
形式 ， 代 码 和 reverse-Bytes 基 本 完全 一 样 。 





i= (i<< 24) | ((i & gxff99) << 8) | 
((i >>> 8) & Oxff00) | (i >>> 24); 





reverse 代 码 为 什么 要 写 得 这 么 星 涩 呢 ? 或 者 说 不 能 用 更 容易 理解 的 
方式 写 吗 ? 比如 ， 实 现 翻 转 ， 一 种 币 见 的 思路 是 : 第 一 个 和 最 后 一 个 区 
换 ， 第 二 个 和 倒数 第 二 个 交换 ， 直 到 中 间 两 个 交换 完成 。 如 果 数 据 不 是 
a 这 个 思路 是 好 的 ， 但 对 于 二 进 制 位 ， 这 个 思路 的 效率 比较 


CPU 指令 并 不 能 高 效 地 操作 单个 位 ， 它 操作 的 最 小 数据 单位 一 般 是 
32 位 〈32 位 机 器 ) ， 另 外 ，CPU 可 以 高 效 地 实现 移 位 和 逻辑 运算 ， 但 实 





现 加 、 减 、 乘 、 除 运算 则 比较 慢 。 

reverse 是 在 充分 利用 CPU 的 这 些 特性 ， 并 行 高 效 地 进行 相 邻 位 的 交 
换 ， 也 可 以 通过 其 他 更 容易 理解 的 方式 实现 相同 功能 ， 但 很 难 比 这 个 
代码 更 高 效 。 
2. 循 环 移 位 

Integer 有 两 个 静态 方法 可 以 进行 循环 移 位 : 





public static int rotateLeft(int i, int distance ) 
public static int rotateRight(int i, int distance) 





rotateLeft 方 法 是 循环 左 移 ，rotateRight 方 法 是 循环 右 移 ，distance 是 
移动 的 位 数 。 所 谓 循环 移 位 ， 是 相对 于 普通 的 移 位 而 言 的 ， 普 通 移 位 ， 
比如 左 移 2 位 ， 原 来 的 最 高 两 位 就 没有 了 ， 夸 边 会 补 0， 而 如 果 是 循环 左 
移 两 位 ， 则 原来 的 最 高 两 位 会 移 到 最 右边 ， 就 像 一 个 左右 相 接 的 环 一 
样 。 看 个 例子 : 








int a = Ox12345678; 

int b = Integer.rotateLeft(a, 8); 
System.out.println(Integer.toHexString(b)); 
int c = Integer.rotateRight(a, 8); 
System.out.println(Integer.toHexString(c)) 





b 是 a 循环 左 移 8 位 的 结果 ，c 是 a 循环 右 移 8 位 的 结果 ， 所 以 输出 为 : 








34567812 
78123456 





这 两 个 函数 的 实现 代码 为 : 





public static int rotateLeft(int i, int distance) { 
return (i << distance) | (i >>> -distance); 


public static int rotateRight(int i, int distance) { 
return (i >>> distance) | (i << -distance); 
} 





这 两 个 函数 中 令 人 费解 的 是 负数 ， 如 果 distance 是 8， 那 i>>>-8 是 什 
么 意思 昵 ? 其 实 ， 实 际 的 移 位 个 数 不 是 后 面 的 直接 数字 ， 而 是 直接 数字 
的 最 低 5 位 的 值 ， 或 者 说 是 直接 数字 &0x1f 的 结果 。 之 所 以 这 样 ， 是 因为 
5 位 最 大 表示 31， 移 位 超过 31 位 对 int 整 数 是 无 效 的 。 


理解 了 移动 负数 位 的 含义 ， 束 比较 容易 理解 上 和 面 这 段 代 码 了 ， 比 
如 ，-8 的 二 进 制 表示 是 : 








11111111111111111111111111111000 





其 最 低 5 位 是 11000， 十 进 制 表 示 束 是 24， 所 以 这 >>-8 就 是 这 >>24， 
i<<8| 这 >>24 就 是 循环 左 移 8 位 。 上 面 代码 中 ， 这 >>-distance 就 是 
i>>> 〈32-distance ) ，i<<-distance 就 是 i<< 〈32-distance) 。 


Integer 中 还 有 一 些 其 他 的 位 操作 ， 具 体 可 参看 API 文 档 。 关 于 其 实 
现代 码 ， 都 有 注释 指向 Hacker's Delight 这 本 书 的 相关 章节 ， 不 再 歼 述 。 


3.valueOf 的 实现 
在 前 面 ， 我 们 提 到 ， 创 建 包装 类 对 象 时 ， 可 以 使 用 静态 的 valueOf 


方法 ， 也 可 以 直接 使 用 new， 但 建议 使 用 valueOf 方 法 ， 为 什么 昵 ? 我 们 
来 看 Integer 的 valueOf 的 代码 〈 基 于 Java7) : 





public static Integer Valueof(int i) { 
assert IntegerCache.high >= 127; 
if (i >= IntegerCache.low && i <= IntegerCache.high) 
return IntegerCache.cache[i + (-IntegerCache.1ow)]; 
return new Integer(i); 


} 





它 使 用 了 IntegerCache， 这 是 一 个 私有 静态 内 部 类 ， 如 代码 清单 7-1 
所 示 。 


代码 清单 7-1 IntegerCache 





private static class IntegerCache { 
static final int low = -128; 
static final int high; 
static final Integer cachel[]; 
static { 


//high value may be configured by property 
int h = 127; 
String integerCacheHighPropValue = 
sunamlscaVMegetSavedProperty( 
"java.lang.Integer.IntegerCache.high"); 
if(integerCacheHighPropValue != null) { 
int i = parseInt(integerCacheHighPropValue); 
i = Math.max(i, 127); 
//Maximum array size is Integer.MAX_ VALUE 
h = Math.min(i, Integer.MAX VALUE - (-low) -1); 


} 

high = h， 

cache = new Integer[(high - low) + 1]; 
int j = low; 


for(int k = 0; k < cache.length; k++) 
cache[k] = new Integer(j++); 


private IntegerCache() 全 
} 





IntegerCache 表 示 Integer 绥 存 ， 其 中 的 cache 变 量 是 一 个 静态 Integer 
数组 ， 在 静态 初始 化 代码 块 中 被 初始 化 ， 默 认 情 况 下 ， 保 存 了 -128 一 
127 共 256 个 整数 对 应 的 Integer 对 象 。 


在 valueOf 代 码 中 ， 如 果 数 值 位 于 被 缓存 的 范围 ， 即 默认 -128 一 
127， A Cache 中 获取 已 预先 创建 的 Integer 对 象 ， 只 有 不 在 
缓存 范围 时 ， 才 通过 new 创 建 对 象 。 


通过 共享 常用 对 象 ， 可 以 节省 内 存 空间 ， 由 于 Integer 是 不 可 变 的 ， 
所 以 缓存 的 对 象 可 以 安全 地 被 共享 。Boolean、Byte、 Short、 Long、 
Character 都 有 类 似 的 实现 。 这 种 共享 常用 对 象 的 思路 ， 是 一 种 常见 的 设 
J 个 名 字 ， 叫 至 元 模式 ， 英 文 叫 Flyweight， 即 共享 的 轻 
量 级 元 








7.1.4 ”剖析 Character 


本 节 探 讨 Character 类 。Character 类 除了 封装 了 一 个 char 外 ， 还 有 什 
么 可 介绍 的 昵 ? 它 有 很 多 静态 方法 ， 封 装 了 Unicode 字 符 级 别 的 各 种 操 
作 ， 是 Java 文 本 处 理 的 基础 ， 注 意 不 是 char 级 别 ，Unicode 字 符 并 不 等 同 
于 char， 本 节 详 细 介 绍 这 些 方法 。 在 此 之 前 ， 先 来 回顾 一 下 Unicode 知 


识 。 











1.Unicode 基 础 


Unicode 给 世界 上 每 个 字符 分 配 了 一 个 编号 ， 编 号 范围 为 0x000000 
一 0xl10FFFF。 编 号 范围 在 0x0000 一 0xFFFF 的 字符 为 常用 字符 集 ， 称 
BMP (Basic Multilingual Plane) 字符 。 编 号 范围 在 0x10000 一 0x10FFFF 
的 字符 叫做 增补 字符 〈supplementary character) 。 


Unicode 主 要 规定 了 编号 ， 但 没有 规定 如 何 把 编号 映射 为 二 进 制 。 
UTF-16 是 一 种 编码 方式 ， 或 者 叫 映 射 方式 ， 它 将 编号 映射 为 两 个 或 4 个 
字 节 ， 对 BMP 字符 ， 它 直接 用 两 个 字 贡 表示 ， 对 于 增补 字符 ， 使 用 4 个 
字 节 表示 ， 前 两 个 字 节 叫 高 代理 项 (high surrogate) ， 范 围 为 0xD800 一 
0xDBFF， 后 两 个 字 节 叫 低 代 理 项 (low surrogate) ， 范 围 为 0xDC00 一 
UTF-16 定 义 了 一 个 公式 ， 可 以 将 编号 与 4 字 节 表示 进行 相互 转 


























Java 内 部 采用 UTF-16 编 码 ，char 表 示 一 个 字符 ， 但 只 能 表示 BMP 中 
的 字符 ， 对 于 增补 字符 ， 需要 使 用 两 个 char 表 示 ， 一 个 表示 高 代理 项 ， 
一 个 表示 低 代 理 项 。 


使 用 int 可 以 表示 任意 一 个 Unicode 字 符 ， 低 21 位 表示 Unicode 编 号 ， 
高 11 位 设 为 0。 整 数 编号 在 Unicode 中 一 般 称 为 代码 点 (code point) ， 
表示 一 个 Unicode 字 符 ， 与 之 相对 ， 还 有 一 个 词 代 码 单 元 (code unit) 
表示 一 个 char。 

Character 类 中 有 很 多 相关 静态 方法 ， 下 面 分 别 介绍 。 


2. 检 查 code point 和 char 

















// 判 断 一 个 int 是 不 是 一 个 有 效 的 代码 点 ， 小 于 等 于 9x19FFFF 的 为 有 效 ， 大 于 的 为 无 效 
public static boolean isValidCodePoint(int codePoint) 

// 判 断 一 个 int 是 不 是 BMP 字符 ， 小 于 等 于 9xFFFF 的 为 BMP 字符 ， 大 于 的 不 是 

public static boolean isBmpCodePoint(int codePoint ) 

// 判 断 一 个 Int 是 不 是 增补 字符 ，9x910000 一 9X19FFFF 为 增补 字符 

public static boolean isSupplementaryCodePoint(int codePoint) 

// 判 断 char 是 否 是 高 代理 项 ，9xD800 一 9xDBFF 为 高 代理 项 
public static boolean isHighSurrogate(char ch) 
// 判 断 char 是 否 为 低 代 理 项 ，9xDC99 一 9xDFFF 为 低 代理 项 
public static boolean isLowSurrogate(char ch) 
// 判 断 char 是 否 为 代理 项 ，char 为 低 代 理 项 或 高 代理 项 ， 则 返回 true 
public static boolean isSurrogate(char ch) 

// 判 断 两 个 字符 high 和 1ow 是 否 分 别 为 高 代理 项 和 低 代理 项 

public static boolean isSurrogatePair(char high, char low) 
// 判 断 一 个 代码 点 由 几 个 char 组 成 ， 增 补 字符 返回 2，BMP 字 符 返 回 1 
public static int charCount(int codePoint) 
































































































































3.code point 与 char 的 转换 


除了 简单 的 检查 外 ，Character 类 中 还 有 很 多 方法 ， 进 行 code point 与 
char 的 相互 转换 。 











// 根 据 高 代理 项 high 和 低 代理 项 low 生 成 代码 点 ， 这 个 转换 有 个 公式 ， 这 个 方法 封装 了 这 个 公式 
public static int toCodePoint(char high, char low) 
// 根 据 代码 点 生成 char 数 组 ， 即 UTF-16 表 示 ， 如 果 code point 为 BMP 字符 ， 则 返回 的 char 
// 数 组 长 度 为 1， 如 果 为 增补 字符 ， 长 度 为 2，char [9] 为 高 代理 项 ，char [1] 为 低 代 理 项 

public static char[] toChars(int codePoint ) 
// 将 代码 点 转换 为 char 数 组 ， 与 上 面 方法 类 似 ， 只 是 结果 存 入 指定 数组 dst 的 指定 位 置 tndex 
public static int toChars(int codePoint，char[] dst, int dstIndex ) 

// 对 增补 字符 code point， 生 成 低 代理 项 
public static char lowSurrogate(int codePoint) 
// 对 增补 字符 code point， 生 成 高 代理 项 
public static char highSurrogate(int codePoint) 





























































































































4. 按 code point 处 理 char 数 组 或 序列 


Character 包 含 知 干 方法 ， 以 方便 按照 code point 处 理 char 数 组 或 序 
列 。 


返回 char 数 组 a 中 从 offset 开 始 count 个 char 包 含 的 code point 个 数 : 





public static int codePointCount(char[] a, int offset, int count ) 





比如 ， 如 下 代码 输出 为 2，char 个 数 为 ?3， 但 code point 为 2。 





char[] chs = new char[3]; 

chs[6] =“ 马 '; 

Character ,tochars(0x1FFFF，chs，1)， 
System.out.println(Character.codePointCount(chs, ©0, 3)); 





除了 接受 char 数 组 ， 还 有 一 个 重 载 的 方法 接受 字符 序列 


CharSequence: 





public static int codePointCount(CharSequence seq, int beginIndex, 
int endIndex) 





CharSequence 是 一 个 接口 ， 它 的 定义 如 下 所 示 : 





public interface CharSequence { 
int length(); 
char charAt(int index); 
CharSequence subSequence(int start, int end); 
public String toString(); 





它 与 = char 数 组 是 类 似 的 ， 有 length 方 法 ， 有 charAt 方 法 根据 索引 
获取 字符 ，String 类 就 实现 了 该 接口 。 


返回 char 数 组 或 序列 中 指定 索引 位 置 的 code point: 








public static int codePointAt(char[] a, int index) 
public static int codePointAt(char[] a, int index, int limit) 
public static int codePointAt(CharSequence seq, int index) 





如 果 指 定 索 引 位 置 为 高 代理 项 ， 下 一 个 位 置 为 低 代 理 项 ， 则 返回 两 
项 组 成 的 code point， 检 查 下 一 个 位 置 时 ， 下 一 个 位 置 要 小 于 limit， 没 传 
limit 时 ， 默 认为 a.length。 


返回 char 数 组 或 序列 中 指定 索引 位 置 之 前 的 code point: 











public static int codePointBefore(char[] a, int index) 
public static int codePointBefore(char[] a, int index, int start) 
public static int codePointBefore(CharSequence seq, int index) 





codePointAt 是 往 后 找 ，codePointBefore 是 往 前 找 ， 如 果 指 定位 置 为 
低 代 理 项 ， 且 前 一 个 位 置 为 高 代理 项 ， 则 返回 两 项 组 成 的 code point， 检 
查 前 一 个 位 置 时 ， 前 一 个 位 置 要 大 于 等 于 start， 没 传 start 时 ， 默 认为 0。 


根据 code point 偏 移 数 计算 char 索 引 : 





public static int offsetByCodePoints(char[] a, int start, int count, 

int index, int codePointoffset) 
public static int offsetByCodePoints(CharSequence seq, int index, 

int codePointoffset ) 





如 果 字 符 数 组 或 序列 中 没有 增补 字符 ， 返 回 值 为 
index+codePointOffset， 如 果 有 增补 字符 ， 则 会 将 codePointOffset 看 作 
code point 偏 移 ， 转 换 为 字符 偏 移 ，start 和 count 取 字符 数组 的 子 数组 。 


比如 ， 如 下 代码 : 





char[] chs = new char[3]; 
Character.toCchars(Ox1iFFFF, chs, 1); 
System.out.println(Character.offsetByCodePoints(chs, 0, 3, 1, 1)); 





输出 结果 为 3，index 和 codePointOffset 都 为 1， 但 第 二 个 字符 为 增补 
字符 ， 一 个 code point 偏 移 是 两 个 char 偏 移 ， 所 以 结果 为 3。 


5. 字 符 属 性 

Unicode 在 给 每 个 字符 分 配 一 个 编号 之 外 ， 还 分 配 了 一 些 属性 ， 
Character 类 封装 了 对 Unicode 字 符 属 性 的 检查 和 操作 ， 下 面 介 绍 一 些 主 
要 的 属性 。 


获取 字符 类 型 (general category) : 





public static int getType(int codePoint) 
public static int getType(char ch) 








Unicode 给 每 个 字符 分 配 了 一 个 类 型 ， 这 个 类 型 是 非常 重要 的 ， 很 
多 其 他 检查 和 操作 都 是 基于 这 个 类 型 的 。getType 方 法 的 参数 可 以 是 int 
类 型 的 code point， 也 可 以 是 char 类 型 。char 类 型 只 能 处 理 BMP 字 符 ， 而 
int 类 型 可 以 处 理 所 有 字符 。Character 类 中 很 多 方法 都 是 既 可 以 接受 int 类 
型 ， 也 可 以 接受 char 类 型 ， 后 续 只 列 出 int 类 型 的 方法 。 返 回 值 是 int， 表 
示 类 型 ，Character 类 中 定义 了 很 多 静态 常量 表示 这 些 类 型 ， 表 7-3 列 出 
了 一 些 字符 、type 值 ， 以 及 Character 类 中 常量 的 名 称 。 


表 7-3 ”第 见 字 符 类 型 值 








Ea type 值 常量 名 称 
UPPERCASE LETTER 
LOWERCASE LETTER 
OTHER LETTER 
DECIMAL DIGIT NUMBER 
SPACE SEPARATOR 
CONTROL 

DASH PUNCTUATION 
START _ PUNCTUATION 
CONNECTOR PUNCTUATION 


OTHER PUNCTUATION 


已 
iD [We [i iD [5 一 一 
(LA 上 SO) 一 一 (LA iD ‘0 hi [ed 


MATH SYMBOL 


2 
hD 
CN 


CURRENCY SYMBOL 





yl 


查 字 符 是 否 在 Unicode 中 被 定义 : 


记 





public static boolean isDefined(int codePoint) 





每 个 被 定义 的 字符 ， 其 getType () 返回 值 都 不 为 0， 如 果 返 回 值 为 
0， 表 示 无 定义 。 注 意 与 isValidCodePoint 的 区 别 ， 后 者 只 要 数字 不 大 于 
0x10FFFF 都 返回 true。 


检查 字符 是 否 为 数字 : 








public static boolean isDigit(int codePoint) 





getType 〈() 返回 值 为 DECIMAL_DIGIT_NUMBER 的 字符 为 数字 。 
需 雪 注意 的 是 ， 个 汉 侍 从 0 ow 、'9' 是 数字 ， 中 文 全 角 字 符 的 0 一 
9 也 是 数字 。 比 如 : 














char ch = '9'; // 中 文 全 角 数 字 
System.out.printin((int)ch+","+Character.isDigit(ch)); 














输出 为 : 





65305, true 





全 角 字 符 的 9，Unicode 编 号 为 65305， 它 也 是 数字 。 
检查 是 否 为 字母 (Letter) : 








public static boolean isLetter(int codePoint) 





如 果 getType 〈) 的 返回 值 为 下 列 之 一 ， 则 为 Letter: 





UPPERCASE_LETTER 
LOWERCASE_LETTER 
TITLECASE_LETTER 
MODIFIER_LETTER 
OTHER_LETTER 





除了 TITLECASE LETTER 和 MODIFIER_LETTER， 其 他 在 表 7-3 中 
有 示例 ， 而 这 两 个 平时 碰 到 的 也 比较 少 ， 就 不 介绍 了 。 


检查 是 否 为 字母 或 数字 : 








public static boolean isLetterOrDigit(int codePoint) 





只 要 其 中 之 一 返回 true 就 返回 true。 


检查 是 否 为 字母 (Alphabetic) : 








public static boolean isAlphabetic(int codePoint) 











这 也 是 检查 是 否 为 字母 ， 与 isLetter 的 区 别 是 : isLetter 返 回 true 时 ， 
isAlphabetic 也 必然 返回 true; 此 外 ，getType 〈) 值 为 
LETTER_NUMBER 时 ，isAlphabetic 也 返回 true， 而 isLetter 返 回 false。 
LETTER_NUMBER 中 常见 的 字符 有 罗马 数字 字符 ， 

Vi ee | ee | ee A 








public static boolean isSpaceChar(int codePoint) 





getType () 值 为 SPACE_SEPARATOR，LINE_SEPARATOR 和 
PARAGRAPH_SEPARATOR 时 ， 返 回 true。 这 个 方法 其 实 并 不 常用 ， 因 
为 它 只 能 严格 匹配 空格 字符 本 身 ， 不 能 匹配 实际 产生 空格 效果 的 字符 ， 
如 Tab 控 制 键 \t'。 


更 第 用 的 检查 空格 的 方法 : 





public static boolean iswWhitespace(int codePoint) 





\t、"\n'、 全 角 空 格 '” ' 和 半角 空格 "的 返回 值 都 为 true。 


检查 是 否 为 小 写字 符 : 








public static boolean isLowerCase(int codePoint) 





常见 的 小 写字 符 主 要 是 小 写 英 文字 母 a 一 z。 


检查 是 否 为 大 写字 符 : 








public static boolean isUpperCase(int codePoint) 





常见 的 大 写字 符 主 要 是 大 写 英 文字 母 A 一 Z。 
检查 是 否 为 表意 象形 文字 : 








public static boolean isIdeographic(int codePoint ) 





大 部 分 中 文 都 返回 为 true。 


检查 是 否 为 ISO 8859-1 编 码 中 的 控制 字符 : 





public static boolean isISOControl(int codePoint) 





我 们 在 第 2 音 介 绍 过 ，0 一 31、127 一 159 表 示 控 制 字符 。 


检查 是 否 可 作为 Java 标 识 符 的 第 一 个 字符 : 





public static boolean isJavalIdentifierStart(int codePoint) 





Java 标 识 符 是 Java 中 的 变量 名 、 子 数 名 、 类 名 等 ， 字 母 
(Alphabetic) 、 美 元 符号 〈$) 、 下 男 线 0) 可 作为 Java 标 识 符 的 第 一 
个 字符 ， 但 数字 字符 不 可 以 。 


检查 是 否 可 作为 Java 标 识 符 的 中 间 字符 : 








public static boolean isJavaIdentifierPart(int codePoint) 





相 比 isJavaIdentifierStart， 主 要 多 了 数字 字符 ，Java 标 识 符 的 中 间 字 
符 可 以 包含 数字 。 


检查 是 否 为 镜像 (mirrowed) 字符 : 








public static boolean isMirrored(int codePoint) 





常见 镜像 字符 有 () 、{}、<>、[]， 都 有 对 应 的 镜像 。 
6. 字 符 转 换 


Unicode 除 了 规定 字符 属性 外 ， 对 有 大 小 写 对 应 的 字符 ， 还 规定 了 
其 对 应 的 大 小 写 ， 对 有 数值 含义 的 字符 ， 也 规定 了 其 数值 。 


我 们 先 来 看 大 小 写 ，Character 有 两 个 静态 方法 ， 对 字符 进行 大 小 写 








转换 





public static int toLowerCase(int codePoint) 
public static int toUpperCase(int codePoint) 





这 两 个 方法 主要 针对 英文 字符 a 一 2 和 A 一 2Z， 例 如 
toLowerCase ('A') 返回 'a'"，toUpper-Case (Z) 返回 'Z'。 


返回 一 个 字符 表示 的 数值 : 





public static int getNumericValue(int codePoint) 











字符 0 一 9 返回 数值 0 一 9， 对 于 字符 a 一 z， 无 论 是 小 写字 符 还 是 大 
写字 符 ， 无 论 是 普通 天文 还 是 中 文人 全角， 数值 结 末 都 是 10 一 35。 例 如 ， 
如 下 代码 的 输出 结果 是 一 样 的 ， 都 是 10。 











System.out.println(Character .getNumericValue('A')); // 全 角 大 写 A 
System,out.println(Ccharacter .getNumericValue('A')); 
System.out.println(Character.getNumericValue('a')); // 全 和 角 小 写 a 
System,out.println(Ccharacter .getNumericValue('a')); 


























返回 按 给 定 进 制 表示 的 数值 : 





public static int digit(int codePoint, int radix) 





radix 表 示 进 制 ， 常 见 的 有 二 进 制 、 八 进 制 、 十 进 制 、 十 六 进 制 ， 计 
算 方 式 与 get-NumericValue 类 似 ， 只 是 会 检查 有 效 性 ， 数 值 需 要 小 于 
radix， 如 果 无 效 ， 返 回 -1。 例 如 : digit (FE'，16) 返回 15， 是 有 效 的 ; 
但 digit ('G'，16) 就 无 效 ， 返 回 -1。 


返回 给 定数 值 的 字符 形式 : 





public static char forDigit(int digit, int radix) 





与 digit (int codePoint，int radix) 相 比 ， 进 行 相反 转换 ， 如 果 数 字 
无 效 ， 返 回 \0'。 例 如 ，Character.forDigit (15，16) 返回 下 '。 


与 Integer 类 似 ，Character 也 有 按 字 节 翻 转 : 





public static char reverseBytes(char ch ) 





例如 ， 翻 转 字 符 0x1234: 





System,out.println(Integer,toHexString( 
Character .reverSeBytes((char )0x1234) ) ) ， 





输出 为 3412。 


至 此 ，Characer 类 就 介绍 完了 ， 它 在 Unicode 字 符 级 别 ( 而 非 char 级 
别 》 封装 了 字符 的 各 种 操作 ， 通过 将 字符 处 理 的 细节 交 给 Character 类 ， 
其 他 类 就 可 以 在 更 高 的 层次 上 处 理 文本 了 。 


7.2 ” 训 析 String 

字符 串 操 作 是 计算 机 程序 中 最 常见 的 操作 之 一 。Java 中 处 理 字符 串 
的 主要 类 是 String 和 StringBuilder， 本 节 介 绍 String。 先 介绍 基本 用 法 ， 
然后 介绍 实现 原理 ， 随 后 介绍 编码 转换 ， 分 析 String 的 不 可 变性 、 常 量 
字符 串 、hashCode 和 正则 表达 式 。 
7.2.1 基本 用 法 


字符 串 的 基本 使 用 是 比较 简单 直接 的 。 可 以 通过 常量 定义 String 变 


地 





String name = " 老 马 说 编程 "， 





也 可 以 通过 new 创 建 String 变 量 : 





String name = new String(" 老 马 说 编程 ") ; 





String 可 以 直接 使 用 和 += 运 算 符 ， 如 : 





String name = " 老 马 " 

name+= "说 编程 " 

String descritpion = "探索 编程 本 质 " 
System,out.println(name+descritpion) ; 





输出 为 : 





老 马 说 编程 ,探索 编程 本 质 





String 类 包括 很 多 方法 ， 以 方便 操作 字符 串 ， 比 如 : 











public boolean isEmpty() // 判 断 字符 串 是 否 为 空 
public int length() // 获 取 字 符 串 长 度 








public String substring(int beginIndex) // 取 子 字符 串 
public String substring(int beginIndex，int endIndex) // 取 子 字符 串 
public int indexof(int ch) // 查 找 字 符 ， 返 回 第 一 个 找到 的 索引 位 置 ， 没 找到 返回 -1 
public int indexof(String str) // 查 找 子 串 ， 返 回 第 一 个 找到 的 索引 位 置 ， 没 找到 返 
public int LastIndexof(int ch) // 从 后 面 查 找 字 符 
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public int lastIndexof(String str) // 从 后 面 查找 子 字符 串 
public boolean contains(CharSequence s) // 判 断 字 符 串 中 是 否 包含 指定 的 字符 序列 
public boolean startswith(String prefix) // 判 断 字符 串 是 否 以 给 定子 字符 串 开 头 




















public boolean endswith(String suffix) // 判 断 字 符 串 是 否 以 给 定子 字符 串 结尾 
public boolean equals(0bject an0bject) // 与 其 他 字符 串 比 较 ， 看 内 容 是 否 相 同 
public boolean equalsIgnoreCase(String anotherString) ]/ 名 各 大 小 写 比较 
public int compareTo(String anotherString) // 比 较 字 符 串 大 小 













































































public int compareToIgnoreCase(String str) // 忽 略 大 小 写 比较 

public String toUpperCase() // 所 有 字符 转换 为 大 写字 符 ， 返 回 新 字符 串 ， 原 字符 串 不 变 
public String toLowerCase() // 所 有 字符 转换 为 小 写字 符 ， 返 回 新 字符 串 ， 原 字符 串 不 变 
public String concat(String str) // 字 符 串 连接 :返回 当前 字符 串 和 参数 字符 串 合并 结果 
public String replace(char oldchar，char newCchar) // 字 符 串 替换 ， 蔡 换 单个 字符 




















// 字 符 串 替换 ， 替 换 字符 序列 ， 返 回 新 字符 串 ， 原 字符 串 不 变 

public String replace(CharSequence target, CharSequence replacement) 
public String trim() // 删 掉 开 头 和 结尾 的 空格 ， 返 回 新 字符 串 ， 原 字符 串 不 变 
public String[] split(String regex) // 分 隔 字 符 串 ， 返 回 分 隔 后 的 子 字符 串 数 组 
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看 个 String 的 简单 例子 ， 按 喜 号 分 隔 "hello，world": 





String str = "hello,world",; 
String[] arr = str.split(","); 





arr[0] 为 "hello"，arr[1] 为 "world"。 


String 的 操作 大 多 简单 直接 ， 不 再 更 述 。 从 调用 者 的 角度 了 解 了 
String 的 基本 用 法 ， 下 面 我 们 进一步 来 理解 String 的 内 部 《代码 基于 Java 
7) 


7.2.2 ” 走 进 String 内 部 


String 类 内 部 用 一 个 字符 数组 表示 字符 串 ， 实 例 变 量 定义 为 : 





private final char valuel[]; 





String 有 两 个 构造 方法 ， 可 以 根据 char 数 组 创建 String 变 量 : 





public String(char value[]) 
public String(char value[], int offset, int count) 





需要 说 明 的 是 ，String 会 根据 参数 新 创建 一 个 数组 ， 并 复制 内 容 ， 
而 不 会 直接 用 参数 中 的 字符 数组 。String 中 的 大 部 分 方法 内 部 也 都 是 操 
作 的 这 个 字符 数组 。 比 如 : 

1) length() 方法 返回 的 是 这 个 数组 的 长 度 。 


2) substring〈) 方法 是 根据 参数 ， 调 用 构造 方法 String (char 
value[]，int offset，int count) 新 建 了 一 个 字符 串 。 


3) indexOf 〈) 方法 碍 找 字 符 或 子 字符 串 时 是 在 这 个 数组 中 进行 得 








找 。 
这 些 方法 的 实现 大 多 比较 直接 ， 不 再 资 述 。 
String 中 还 有 一 些 方法 ， 与 这 个 char 数 组 有 关 : 





public char charAt(int index) // 返 回 指定 索引 位 置 的 char 

// 返 回 字 符 串 对 应 的 char 数 组 ， 注 意 ， 返 回 的 是 一 个 复制 后 的 数组 ， 而 不 是 原 数组 

public char[] tocharArray() 

// 将 char 数 组 中 指定 范围 的 字符 复制 入 目标 数组 指定 位 置 

public void getChars(int srcBegin, int srcEnd, char dst[], int dstBegin) 






































与 Character 类 似 ，String 也 提供 了 一 些 方法 ， 按 代码 点 对 字符 串 进 
行 处 理 ， 有 具体 不 再 更 述 。 





public int codePointAt(int index) 

public int codePointBefore(int index) 

public int codePointCount(int beginIndex, int endIndex ) 
public int offsetByCodePoints(int index, int codePointoffset ) 





7.2.3 ”编码 转换 


String 内 部 是 按 UTF-16BE 人 处理 字符 的 ， 对 BMP 字 符 ， 使 用 一 个 
char， 两 个 字 节 ， 对 于 增补 字符 ， 使 用 两 个 char， 四 个 字 节 。 我 们 在 第 
2.3 节 介绍 过 各 种 编码 ， 不 同 编码 可 能 用 于 不 同 的 字符 集 ， 使 用 不 同 的 
字 节 数目 ， 以 及 不 同 的 二 进 制 表示 。 如 何 处 理 这 些 不 同 的 编码 呢 ? 这 些 
编码 与 Java 内 部 表示 之 间 如 何 相互 转换 呢 ? 








Java 使 用 Charset 类 表示 各 种 编码 ， 它 有 两 个 常用 静态 方法 : 





public static Charset defaultCharset() 
public static Charset forName(String charsetName) 





第 一 个 方法 返回 系统 的 默认 编码 ， 比 如 ， 在 笔者 的 计算 机 中 ， 执 行 
如 下 语句 : 





System.out.println(Charset.defaultCharset().name()); 





输出 为 UTF-8。 


第 二 个 方法 返回 给 定编 码 名 称 的 Charset 对 象 ， 与 我 们 在 2.3 节 介绍 
的 编码 相对 应 ， 其 charset 名 称 可 以 是 US-ASCII、ISO-8859-1、windows- 
1252、GB2312、GBK、GB18030、Big5、UTF-8 等 ， 比 如 : 





Charset charset = Charset.forName("GB18030"); 





String 类 提供 了 如 下 方法 ， 返 回 字符 串 按 给 定编 码 的 字 市 表示 : 





public byte[] getBytes() 
public byte[] getBytes(String charsetName) 
public byte[] getBytes(Charset charset) 





第 一 个 方法 没有 编码 参数 ， 使 用 系统 默认 编码 ; 第 二 个 方法 参数 为 
编码 名 称 ; 第 三 个 方法 参数 为 Charset。 


String 类 有 如 下 构造 方法 ， 可 以 根据 字 节 和 编码 创建 字符 串 ， 也 就 
是 说 ， 根 据 给 定编 码 的 字 节 表示 ， 创 建 Java 的 内 部 表示 。 








public String(byte bytes[], int offset, int length, String charsetName) 
public String(byte bytes[], Charset charset) 





除了 通过 String 中 的 方法 进行 编码 转换 ，Charset 类 中 也 有 一 些 方法 
进行 编码 /解码 ， 本 书 就 不 介绍 了 。 重 要 的 是 认识 到 ，Java 的 内 部 表示 与 


各 种 编码 是 不 同 的 ， 但 可 以 相互 转换 。 
7.2.4 不 可 变性 


与 包 闭 类 类 似 ，String 类 也 是 不 可 变 类 ， 即 对 象 一 旦 创建 ， 就 没有 
办 法 修改 了 。String 类 也 声明 为 了 final， 不 能 被 继承 ， 内 部 char 数 组 value 
也 是 final 的 ， 初 始 化 后 就 不 能 再 变 了 。 


String 类 中 提供 了 很 多 看 似 修改 的 方法 ， 其 实 是 通过 创建 新 的 String 
、 原来 的 String 对 象 不 会 被 修改 。 比 如 ，concat 〈) 方法 的 
尺码 : 





public String concat(String str) { 
int otherLen = str.length(); 
if(otherLen == 0) { 
return this; 


int len = value.length; 

char buf[] = Arrays.copyof(value, len + otherLen); 
str.getchars(buf, len); 

return new String(buf, true); 





通过 Arrays.copyOf 方 法 创建 了 一 块 新 的 字符 数组 ， 复 制 原 内 容 ， 然 
后 通过 new 创 建 了 一 个 新 的 String， 最 后 一 行 调用 的 是 String 的 另 一 个 构 





String(char[] value, boolean share) 
//assert share : "unshared not supported"; 
this.value = value; 


} 





这 是 一 个 非 公 开 的 构造 方法 ， 直 接 使 用 传递 过 来 的 数组 作为 内 部 数 
组 。 关 于 Arrays 类 ， 我 们 在 7.4 市 介绍 。 


与 包装 类 类 似 ， 定 义 为 不 可 变 类 ， 程 序 可 以 更 为 简单 、 安 人 全、 容易 
理解 。 但 如 果 频 楷 修 改 字符 串 ， 而 每 次 修改 都 新 建 一 个 字符 串 ， 那 么 性 
能 太 低 ， 这 时 ， 应 该 考虑 Java 中 的 另 两 个 类 StringBuilder 和 
StringBuffer。 


7.2.5 ”各 量 字符 串 


Java 中 的 字 符 串 常量 是 非常 特殊 的 ， 除 了 可 以 直接 赋值 给 String 变 
量 外 ， 它 自己 就 像 一 个 String 类 型 的 对 象 ， 可 以 直接 调用 String 的 各 种 方 
法 。 我 们 来 看 代码 : 





System.out.println(" 老 马 说 编程 " .length()); 
System.out.println(" 老 马 说 编程 ".contains(" 老 马 ")); 
System.out.println(" 老 马 说 编程 " ,indexof(" 编 程 " ) ) ; 








实际 上 ， 这 些 徊 量 束 是 String 类 玲 的 对 象 ， 在 内 存 中 ， 它 们 人 彼 放 在 
一 个 共 至 的 地 廊 ， 这 个 地 方 称 为 字符 串 常量 池 ， 它 保存 所 有 的 常量 字 
符 串 ， 每 个 常量 只 会 保存 一 份 ， 被 所 有 使 用 着 共享 。 当 通过 第 量 的 形式 
代用 一 上 字符 串 的 时 候 ， 使 用 的 就 是 常量 池 中 的 那个 对 应 的 String 类 型 
区 


比如 以 下 代码 : 

















String name1 =" 老 马 说 编程 "， 
String name2 = " 老 马 说 编程 "， 
System,out.println(Cname1==name2 ) ; 











输出 为 tue。 为 什么 呢 ? 可 以 认为 ，" 老 马 说 编程 "在 种 量 池 中 有 一 
个 对 应 的 String 类 型 的 对 象 ， 我 们 假定 名 称 为 laoma， 上 面 的 代码 实际 上 
就 类 似 于 : 





String laoma = new String(new char[]{' 老 ', ' 杞 ', ' 说 ', ' 编 ', ' 程 '}); 
String name1 = laoma; 

String name2 = laoma; 

System,.out.println(name1==name2); 





实际 上 只 有 一 个 String 对 象 ， 三 个 变量 都 指 同 这 个 对 象 ， 
namel==name2 也 就 不 言 而 只 了。 


需要 注意 的 是 ， 如 果 不 是 通过 常量 直接 赋值 ， 而 是 通过 new 创 建 ， 
== 束 不 会 返回 true 『 了 ， 看 下 面 的 代码 : 








String name1 = new String(" 老 马 说 编程 " ) ; 
String name2 = new String(" 老 马 说 编程 " ) ， 
System.out.println(name1==name2); 








输出 为 false。 为 什么 呢 ? 上 面 代 码 类 似 于 : 





String laoma = new String(new char[]{' 老 ', ' 蕊 ', ' 说 ', ' 编 ', ' 程 '}); 
String name1 = new String(laoma); 
String name2 = new String(laoma); 
System.out.println(name1==name2); 





String 类 中 以 String 为 参数 的 构造 方法 代码 如 下 : 





public String(String original) { 
this.value = original.value,; 
this.hash = original.hash,; 








hash 是 String 类 中 男 一 个 实例 变量 ， 表 示 绥 存 的 hashCode 值 。 


可 以 看 出 ，namel 和 name2 指 癌 两 个 不 同 的 String 对 象 ， 只 是 这 两 个 
对 象 内 部 的 value 值 指向 相同 的 char 数 组 。 其 内 存 布局 如 图 7-1 所 示 。 


namel!=name2 
namel.equals(name2)==true 


namel 对 象 
人 
0x8000 | 





本 电 
name2 下 量 “| Ox4000 | ox2000Cvalue) 


name2 对 象 


图 7-1 两 个 String 对 象 的 内 存 布 局 


| ox1004 | hash 
| 
老 马 说 编程 





0x8000 | Ox2000(value) SS 0x1000 “| QOx2000(value) 





所 以 ，name1==name2 不 成 也 ， 但 namel.equals (name2) 是 true。 


7.2.6 hashCode 





7.2.5 节 中 提 到 hash 这 个 实例 变量 ， 它 的 定义 如 下 : 





private int hash; //Default to 0 





hash 变 量 缓存 了 hashCode 方 法 的 值 ， 也 就 是 说 ， 第 一 次 调用 
hashCode 方 法 的 时 候 ， 会 把 结果 保存 在 hash 这 个 变量 以 后 再 调用 就 
直接 返回 保存 的 值 。 


我 们 来 看 下 String 类 的 hashCode 方 法 ， 代 码 如 下 : 





public int hashCode() { 
int h = hash; 
if(h == 0 && value.length > 0) { 
char val[] = value; 
for(int i = 0; i < value.length; i++) { 
h=31* h + val[il; 


} 
hash = h; 


} 
return h; 


} 








如 果 绥 存 的 hash 不 为 0， 束 直接 返回 了 ， 人 否则 根据 字符 数组 中 的 内 
容 计 算 hash， 计 算 方法 是 : 





s[0]*31^(n-1) + S[1]*31^A(n-2) + ... + Ss[n-1] 





s 表 示 字 符 串 ，s[0] 表 示 第 一 个 字符 ，n 表 示 字 符 串 长 度 ， 
s[0]*31A (Cn-1) 表示 31 的 (Cn-1) 次 方 再 乘 以 第 一 个 字符 的 值 。 


为 什么 要 用 这 个 计算 方法 呢 ? 使 用 这 个 式 子 ， 可 以 让 hash 值 与 每 个 
字符 的 值 有 关 ， 也 与 每 个 字符 的 位 置 有 关 ， 位 置 i (i>=1) 的 因素 通过 31 
的 〈n-i) 次 方 表示 。 使 用 31 大 致 是 因为 两 个 原因 : 一 方面 可 以 产生 更 分 
散 的 散 列 ， 即 不 同 字符 串 hash 值 也 一 般 不 同 ; 另 一 方面 计算 效率 比较 





高 ，31*h 与 32*h-h 即 〈h<<5) -h 等 价 ， 可 以 用 更 高 效率 的 移 位 和 减法 操 
作 代 登 乘 法 操作 。 


在 Java 中 ， 普 遍 采 用 以 上 思路 来 实现 hashCode。 


7.27 正则 表达 式 





String 类 中 ， 有 一 些 方法 接受 的 不 是 普通 的 字符 串 参 数 ， 而 是 正则 
表达 式 。 什 么 是 正则 表达 式 呢 ?正则 表达 式 可 以 理解 为 一 个 字符 串 ， 但 
表达 的 是 一 个 规则 ， 一 般 用 于 文本 的 匹配 、 碍 找 、 符 换 等 。 正 则 表达 式 
具有 丰 语 和 强大 的 功能 ， 是 一 个 比较 大 的 话题 ， 我 们 在 第 25 章 单独 介 


绍 。 





Java 中 有 专门 的 类 〈 如 Pattern 和 Matcher) 用 于 正则 表达 式 ， 但 对 于 
String 类 提供 了 更 为 简洁 的 操作 ，String 中 接受 正则 表达 式 
3 方 * : 





public String[] split(String regex)  // 分 隔 字符 串 
public boolean matches(String regex) // 检 查 是 否 匹 配 

public String replaceFirst(String regex，String replacement) // 字 符 串 荷 换 
public String replaceAll(String regex，String replacement) // 字 符 串 替换 

















至 此 ， 关 于 String 的 用 法 、 原 理 和 特性 等 基本 介绍 完了 。 关 于 String 
的 实现 原理 ， 值 得 了 解 的 是 ，Java 9 对 String 的 实现 进行 了 优化 ， 它 的 内 
部 不 是 char 数 组 ， 而 是 byte 数 组 ， 如 果 字 符 都 是 ASCI[ 字 符 ， 它 就 可 以 使 
用 一 个 字 节 表示 一 个 字符 ， 而 不 用 UTF-16BE 编 码 ， 节 省 内 存 。 


7.3 ”剖析 StringBuilder 


7.2.4 节 提 到 ， 如 果 字 符 串 修改 操作 比较 频繁 ， 应 该 采用 
StringBuilder 和 StringBuffer 类 ， 这 两 个 类 的 方法 基本 是 完全 一 样 的 ， 它 
们 的 实现 代码 也 几乎 一 样 ， 唯 一 的 不 同 束 在 于 StringBuffer 类 是 线程 安全 
的 ， 而 StringBuilder 类 不 是 。 


关于 线程 的 概念 ， 我 们 到 第 15 章 再 介绍 。 这 里 需要 知道 的 就 是 ， 线 
程 安 全 是 有 成 本 的 ， 有 影响 性 能 ， 而 字符 串 对 象 及 操作 大 部 分 情况 下 不 存 
在 线程 安全 问题 ， 适 合 使 用 String-Builder 类 。 所 以 ， 本 节 就 只 讨论 
StringBuilder 类 ， 包 括 基 本 用 法 和 基本 原理 。 








7 王 下 用 和 芭 


StringBuilder 的 基本 用 法 很 简单 。 创 建 StringBuilder 对 和 象 : 





StringBuilder sb = new StringBuilder(); 





通过 append 方 法 添加 字符 串 : 





sb,append(" 老 马 说 编程 " ) ; 
sb.append(", 探索 编程 本 质 " ) ; 





通过 toString 方 法 获取 构建 后 的 字符 串 : 





System,.out.println(sb,toString() )， 





输出 为 : 





老 马 说 编程 ,探索 编程 本 质 





大 部 分 情况 ， 使 用 就 这 么 简单 ， 通 过 new 新 建 StringBuilder 对 象 ， 通 





过 append 方 法 添加 字符 串 ， 然 后 通过 toString 方 法 获取 构建 完成 的 字符 
=- 





7.3.2 ”基本 实现 原理 


StringBuilder 类 是 怎么 实现 的 呢 ? 我 们 来 看 下 它 的 内 部 组 成 ， 以 及 
一 些 主要 方法 的 实现 ， 代 码 基 于 Java 7。 与 String 类 似 ，StringBuilder 类 
也 封装 了 一 个 字符 数组 ， 定 义 如 下 : 





char[] value 








与 String 不 同 ， 它 不 是 final 的 ， 可 以 修改 。 hs 与 String 不 同 ， 了 
符 数组 中 不 一 定 所 有 位 置 都 已 经 被 使 用 ， 它 有 一 个 实例 变量 ， 表 示 数 组 
中 已 经 使 用 的 字符 个 数 ， 定 义 如 下 : 








int count,; 





StringBuilder 继 承 自 AbstractStringBuilder， 它 的 默认 构造 方法 是 : 





public StringBuilder() { 
super(16); 








调用 父 类 的 构造 方法 ， 父 类 对 应 的 构造 方法 是 : 





AbstractStringBuilder(int capacity) { 
value = new char[capacity]; 


} 





也 就 是 说 ，new StringBuilder() 代码 内 部 会 创建 一 个 长 度 为 16 的 
字符 数组 ，count 的 默认 值 为 0。 来 看 append 方 法 的 代码 : 





public AbstractStringBuilder append(String str) { 
if(str == null) str = "null"; 
int len = str.length(); 
ensureCapacityInternal(count + len); 


str.getchars(0, len, value, count); 
count += len; 
return this; 


} 





append 会 直接 复制 字符 到 内 部 的 字符 数组 中 ， 如 有 果 字 符 数组 长 度 不 
够 ， 会 进行 扩展 ， 实 际 使 用 的 长 度 用 count 体 现 。 有 具体 来 说 ， 
ensureCapacityInternal (count+len ) 会 确保 数组 的 长 度 足 以 容纳 新 添加 
的 字符 ，str.getChars 会 复制 新 添加 的 字符 到 字符 数组 中 ，count+=len 会 
增加 实际 使 用 的 长 度 。 


ensureCapacityInternal 的 代码 如 下 : 








private void ensureCapacityInternal(int minimumCapacity) { 
//overflow-conscious code 
if(minimumCapacity - value.length > 0) 
expandCapacity(minimumCapacity ) ， 





如 果 字 符 数 组 的 长 度 小 于 需要 的 长 度 ， 则 调用 expandCapacity 进 行 
扩展 ， 其 代码 为 : 





void expandCapacity(int minimumCapacity) { 
int newCapacity = value.length * 2 + 2; 
if(newCapacity - minimumCapacity < 0) 
newCapacity = minimumCapacity; 
if(newCapacity < 0) { 
If (minimumCapacity < 0) //overflow 
throw new OutOofMemoryError(); 
newCapacity = Integer .MAX_VALUE， 


value = Arrays.copyof(value，newCapacity ) ， 





扩展 的 逻辑 是 : 分 配 一 个 足够 长 度 的 新 数组 ， 然 后 将 原 内 容 复制 到 
这 个 新 数组 中 ， 最 后 让 内 部 的 字符 数组 指向 这 个 新 数组 ， 这 个 逻辑 主要 
徘 下 面 的 代码 实现 : 





value = Arrays.copyof(value，newCapacity ) ， 








关于 类 Arrays， 我 们 下 一 节 介 绍 ， 这 里 主要 看 下 newCapacity 是 怎么 





算出 来 的 。 参 数 minimumCapacity 表 示 需 要 的 最 小 长 度 ， 需 要 多 少 分 配 
多 少 不 就 行 了 吗 ? 不 行 ， 因 为 那 就 跟 String 一 样 了 ， 每 append 一 次 ， 都 
会 进行 一 次 内 存 分 配 ， 效 率 低下 。 这 里 的 扩展 策略 是 跟 当 前 长 度 相关 

的 ， 当 前 长 度 乘 以 2， 再 加 上 2， 如 果 这 个 长 度 不 够 最 小 需要 的 长 度 ， 才 


用 minimumCapacity。 


比如 ， 默 认 长 度 为 16， 长 度 不 够 时 ， 会 先 扩展 到 16*2+2 即 34， 然 后 
扩展 到 34*2+2 即 70， 然 后 是 70*2+2 即 142， 这 是 一 种 指数 扩展 策略 。 为 
什么 要 加 2? 这 样 ， 在 原 长 度 为 0 时 也 可 以 一 样 工 作 。 


为 什么 要 这 么 扩展 呢 ? 这 是 一 种 折 中 策略 ， 一 方面 要 减少 内 存 分 配 
的 次 数 ， 另 一 方面 要 避免 空间 浪费 。 在 不 知道 最 终 需 要 多 长 的 情况 下 ， 
指数 扩展 是 一 种 第 见 的 策略 ， 广 泛 应 用 于 各 种 内 存 分 配 相 关 的 计算 机 程 
序 中 。 不 过 ， 如 果 预 先 就 知道 需要 多 长 ， 那 么 可 以 调用 StringBuilder 的 
Em A a 

















public StringBuilder(int capacity) 





字符 串 构建 完 后 ， 我 们 来 看 toString 方 法 的 代码 : 





public String toString() { 
//Create a copy, don't share the array 
return new String(value, ©0, count); 


} 





基于 内 部 数组 新 建 了 一 个 String。 注 意 ， 这 个 String 构 造 方法 不 会 直 
接 用 value 数 组 ， 而 会 新 建 一 个 ， 以 保证 String 的 不 可 变性 。 


除了 append 和 toString 方 法 ，StringBuilder 还 有 很 多 其 他 方法 ， 包 括 
更 多 构造 方法 、 更 多 append 方 法 、 插 入 、 删 除 、 蔡 换 、 和 翻转、 长度 有 关 
的 方法 ， 限 于 篇 幅 ， 就 不 一 一 列举 了 。 主 要 看 下 插入 方法 。 在 指定 索引 
offset 处 插入 字符 串 str: 











public StringBuilder insert(int offset, String str) 





原来 的 字符 后 移 ，offset 为 0 表示 在 开头 插 ， 为 length〈) 表示 在 结 


尾 插 ， 比 如 : 





StringBuilder sb = new StringBuilder(); 
sb.append(" 老 马 说 编程 " ) ; 

sb.insert(0, "关注 ")， 

sb.insert(sb.1length()，" 老 马 和 你 一 起 探索 编程 本 质 " ) ; 
sb.insert(7, ","); 
System,.out.println(sb.tostring()); 





输出 为 : 





关注 老 马 说 编程 , 老 马 和 你 一 起 探索 编程 本 质 





了 解 了 用 法 ， 下 面 来 看 insert 的 实现 代码 : 





public AbstractStringBuilder insert(int offset, String str) { 

if((offset < 0) || (offset > length())) 

throw new StringIndexOutOofBoundsException(offset); 
if(str == null) 

str = "null",; 
int len = str.length(); 
ensureCapacityInternal(count + len); 
System.arraycopy(value, offset, value, offset + len, count - offset); 
str.getchars(value, offset); 
count += len; 
return this,; 











这 个 实现 思路 是 : 在 确保 有 足够 长 度 后 ， 首 先 将 原 数 组 中 offset 开 
始 的 内 容 问 后 挪动 n 个 位 置 ，n 为 待 插入 字符 串 的 长 度 ， 然 后 将 待 插入 字 
符 串 复制 进 offset 位 置 。 


挪动 位 置 调用 了 System.arraycopy 〈) 方法 ， 这 是 个 比较 常用 的 方 
法 ， 它 的 声明 如 下 : 








public static native void arraycopy(Object src, int SrcPos， 
Object dest, int destPos, int length); 





将 数组 src 中 srcPos 开 始 的 length 个 元 素 复 制 到 数组 dest 中 destPos 处 。 
这 个 方法 有 个 优点 : 即使 src 和 dest 是 同一 个 数组 ， 它 也 可 以 正确 处 理 。 
比如 下 面 的 代码 : 





int[] arr = new int[]{1,2,3,4}; 
System.arraycopy(arr, 1, arr, 0, 3); 
System.out.println(arr[0]+","+arr[1]+","+arr[2]); 





这 里 ，src 和 dest 都 是 arr，srcPos 为 1，destPos 为 0，length 为 3， 表 示 
将 第 二 个 元 素 开 始 的 三 个 元 聂 移 到 开头 ， 所 以 输出 为 : 











arraycopy 的 声明 有 个 修饰 符 native， 表 示 它 的 实现 是 通过 Java 本 地 
接口 实现 的 。Java 本 地 接口 是 Java 提 供 的 一 种 技术 ， 用 于 在 Java 中 调用 
非 Java 实 现 的 代码 ， 实 际 上 ，array-copy 是 用 C++ 语言 实现 的 。 为 什么 要 
用 C++ 语言 实现 呢 ? 因为 这 个 功能 非常 利用 ， 而 C++ 的 实现 效率 要 远 高 
于 Java。 





7.3.3 Soing 的 + 和 + 运算 符 


Java 中 ，String 可 以 直接 使 用 + 和 += 运 算 符 ， 这 是 Java 编 译 器 提供 的 
文 持 ， 背 后 ，Java 编 译 右 一 般 会 生成 StringBuilder，+ 和 += 操 作 会 转换 为 
append。 比 如 ， 如 下 代码 : 





String hello = "hello"; 
hello+=",world"; 
System,.out.println(hello); 





背后 ，Java 编 译 占 一 般 会 转换 为 : 





StringBuilder hello = new StringBuilder("hello"); 
hello.append(",world"); 
System,.out.println(hello.tostring()); 





既然 直接 使 用 + 和 += 就 相当 于 使 用 StringBuilder 和 append， 那 还 有 什 
么 必要 直接 使 用 StringBuilder 呢 ? 在 简单 的 情况 下 ， 确 实 没 必 要 。 不 
过 ， 在 稍微 复杂 的 情况 下 ，Java 编 译 器 可 能 没有 那么 智能 ， 它 可 能 会 生 
成 过 多 的 StringBuilder， 尤 其 是 在 有 循环 的 情况 下 ， 比 如 ， 如 下 代码 : 








String hello = "hello"; 
for(int i=0;i<3;i++){ 
hello+=",world"; 


System.out.println(hello); 





Java 编 译 占 转换 后 的 代码 大 致 如 下 所 示 : 





String hello = "hello"; 

for(int i=0;i<3;i++){ 
StringBuilder sb = new StringBuilder(hello); 
sb.append(",world"); 
hello = sb.toString(); 


System.out.println(hello); 





在 循环 内 部 ， 每 一 次 += 操 作 ， 都 会 生成 一 个 StringBuilder。 


所 以 ， 对 于 简单 的 情况 ， 可 以 直接 使 用 String 的 + 和 +=， 对 于 复杂 的 
情况 ， 尤 其 是 有 循环 的 时 候 ， 应 该 直接 使 用 StringBuilder。 





7.4 剖析 Arrays 





数组 是 存储 多 个 同类 型 元 素 的 基本 数据 结构 ， 数 组 中 的 元 系 在 内 存 
连续 存放 ， 可 以 通过 数组 下 标 直 接 定位 任意 元 素 ， 相 比 在 后 续 章 介绍 
的 其 他 容器 而 言 效率 非常 高 。 


数组 操作 是 计算 机 程序 中 的 常见 基本 操作 。Java 中 有 一 个 类 
Arrays， 包 含 一 些 对 数组 操作 的 静态 方法 ， 本 市 主要 就 来 讨论 这 些 方 
法 。 首 先 介 绍 怎么 用 ， 然 后 介绍 它们 的 实现 原理 。 学 习 Arrays 的 用 法 ， 
就 可 以 “避免 重新 发 明 轮 子 "， 直 接 使 用 ， 学 习 它 的 实现 原理 ， 就 可 以 在 
需要 的 时 候 自 己 实现 它 不 具备 的 功能 。 

















7.4.1 用 法 





Arrays 类 中 有 很 多 方法 ， 我 们 主要 介绍 toString、 排 序 、 碍 找 ， 对 于 
一 些 其 他 方法 ， 如 复制 、 比 较 、 批 量 设置 值 和 计算 哈 希 值 等 ， 我 们 也 进 
行 简单 介绍 。 


1.toString 


Arrays 的 toString() 方法 可 以 方便 地 输出 一 个 数组 的 字符 串 形式 ， 
以 便 碍 看 。 它 有 9 个 重 载 的 方法 ， 包 括 8 个 基本 类 型 数组 和 1 个 对 象 类 型 
数组 ， 下 面 列举 两 个 : 





public static String toString(int[] a) 
public static String toString(Object[] a) 





例如 : 





int[] arr = {9,8,3,4}; 
System.out.println(Arrays.toSstring(arr)); 
String[] strArr = {"hello", "world"}; 
System,.out.println(Arrays.toSstring(strArr)); 





输出 为 : 





[9, 8, 3, 4] 
[hello, world] 





如 果 不 使 用 Arrays.toString 方 法 ， 直 接 输 出 数组 自身 ， 即 代码 改 为 : 





int[] arr = {9,8,3,4}; 
System.out.println(arr); 

String[] strArr = {"hello", "world"}; 
System,.out.println(strArr); 





则 输出 会 变 为 如 下 所 示 : 





[I@1224b90 
[Ljava.1lang.Sstring;@728edb84 








这 个 输出 就 难以 阅读 了 ，@ 后 面 的 数字 表示 的 是 内 存 的 地 址 。 
2. 排 序 


排序 是 一 种 非常 常见 的 操作 。 同 toString 一 样 ， 对 每 种 基本 类 型 的 
数组 ，Arrays 都 有 sort 方 法 〈boolean 除 外 ) ， 例 如 : 








public static void sort(int[] a) 
public static void sort(double[] a) 





排序 按照 从 小 到 大 升序 排列 ， 例 如 : 





int[] arr = {4, 9, 3, 6, 10}; 
Arrays.sort(arr); 
System.out.println(Arrays.toSstring(arr)); 





输出 为 : 





[3, 4, 6, 9, 10] 








数组 已 经 排 好 序 了 。 








除了 基本 类 型 ，sort 还 可 以 直接 接受 对 象 类 型 ， 但 对 象 需要 实现 
Comparable 接 口 。 





public static void sort(Object[] ay) 
public static void sort(Object[] a, int fromIndex, int toIndex) 





我 们 看 个 String 数 组 的 例子 : 





String[] arr = {"hello","world", "Break","abc"}; 
Arrays.sort(arr); 
System,out.println(Arrays,toString(arr))， 





输出 为 : 





[Break, abc, hello, world] 











"Break" 之 所 以 排 在 最 前 面 ， 是 因为 大 写字 母 的 ASCII 码 比 小 写字 母 
都 小 。 那 如 果 排 序 的 时 候 希 望 忽 略 大 小 写 呢 ?sort 还 有 男 外 两 个 重 载 方 
法 ， 可 以 接受 一 个 比较 器 作为 参数 : 





public static <T> void sort(T[] a, Comparator<? super T> c) 
public static <T> void sort(T[] a, int fromIndex, int toIndex, 
Comparator<? super T> c) 





方法 声明 中 的 T 表 示 泛 型 ， 泛 型 我 们 在 第 8 章 介 绍 ， 这 里 表示 的 是 ， 
这 个 方法 可 以 文 持 所 有 对 象 类 型 ， 只 要 传递 这 个 类 型 对 应 的 比较 问 束 可 
以 了 。Comparator 就 是 比较 器 ， 它 是 一 个 接口 ，Java 7 中 的 定义 是 : 





public interface Comparator<T> { 
int compare(T o1, T 02) 
boolean equals(Object obj); 
} 








最 主要 的 是 compare 这 个 方法 ， 它 比较 两 个 对 象 ， 返 回 一 个 表示 比 
较 结 果 的 值 ，-1 表 示 o1 小 于 02，0 表 示 ol 等 于 o2，1 表 示 o1 大 于 o2。 排 序 
是 通过 比较 来 实现 的 ，sort 方 法 在 排序 的 过 程 中 需要 对 对 象 进行 比较 的 
时 候 ， 就 调用 比较 器 的 compare 方 法 。Java 8 中 Comparator 增 加 了 多 个 静 





态 和 默认 方法 ， 有 具体 可 参看 API 文 档 。 
String 类 有 一 个 public 静 态 成 员 ， 表 示 急 略 大 小 写 的 比较 器 : 





public static final Comparator<String> CASE_INSENSITIVE_ORDER 
= new CaseInsensitiveComparator(); 





我 们 通过 这 个 比较 器 再 来 对 上 面 的 String 数 组 排 友 : 





String[] arr = {"hello","world", "Break","abc"}; 
Arrays.sort(arr, String.CASE INSENSITIVE_ ORDER); 
System,out.println(Arrays,toString(arr))， 





这 样 ， 大 小 写 残 忽略 了 ， 输 出 变 为 : 





[abc, Break, hello, world] 





为 进一步 理解 Comparator， 我 们 来 看 下 String 的 这 个 比较 器 的 主要 
实现 代码 ， 如 代码 清单 7-2 所 示 。 


代码 清单 7-2” String 的 CaseInsensitiveComparator 实 现 





private static Class CaseInsensitiveComparator 
implements Comparator<String> { 
public int compare(String si1, String S2) { 
int ni = si1.length(); 
int n2 = s2.length(); 
int min = Math.min(n1i, n2); 
for(int i = 0; i < min; i++) { 
char c1 = si.charAt(i); 
char c2 = s2.charAt(i); 
if(c1i != c2) { 
c1 = Character.toUpperCase(c1); 
c2 = Character.toUpperCase(c2); 
if(c1 != c2) { 
c1 = Character.toLowerCase(c1); 
c2 = Character.toLowerCase(c2); 
if(c1 != c2) { 
//No overflow because of numeric promotion 
return c1 - c2; 


} 


return ni - n2; 





代码 比较 简单 直接 ， 驶 不 解释 了 。 


sort 方 法 默认 是 从 小 到 大 排序 ， 如 果 和 希望 按照 从 大 到 小 排序 呢 ? 对 
于 对 象 类 型 ， 可 以 指定 一 个 不 同 的 Comparator， 可 以 用 匿名 内 部 类 来 实 
现 Comparator， 比 如 : 








String[] arr = {"hello","world", "Break","abc"}; 
Arrays.sort(arr, new Comparator<String>() { 
Q@Override 
public int compare(String o1, String 02) { 
return o2.compareToIgnoreCase(o1); 


} 
}); 
System,.out.println(Arrays.toString(arr)); 





程序 输出 为 : 





[world, hello, Break, abc] 





以 上 代码 使 用 一 个 匿名 内 部 类 实现 Comparator 接 口 ， 返 回 o2 与 o1 进 
行 急 略 大 小 写 比较 的 结果 ， 这 样 就 能 实现 忽略 大 小 写 且 按 从 大 到 小 排 


序 。 


Collections 类 中 有 两 个 静态 方法 ， 可 以 返回 逆序 的 Comparator， 例 
如 : 





public static <T> Comparator<T> reverseorder() 
public static <T> Comparator<T> reverseOrder(Comparator<T> cmp) 





关于 Collections 类 ， 我 们 在 12.2 节 介绍 。 


这 样 ， 上 面 字符 串 忽略 大 小 写 逆序 排序 的 代码 可 以 改 为 : 





String[] arr = {"hello","world", "Break","abc"}; 
Arrays.sort(arr, Collections.reverseOrder(String.CASE INSENSITIVE ORDER)); 
System,out.println(Arrays,toString(arr))， 





传递 比较 器 Comparator 给 sort 方 法， 体现 了 程序 设计 中 一 种 重要 的 
思维 方式 。 将 不 变 和 变化 相 分 离 ， 排 序 的 基本 步骤 和 算法 是 不 变 的 ， 但 
按 什么 排序 是 变化 的 ，sort 方 法 将 不 变 的 算法 设计 为 主体 逻辑 ， 而 将 变 
化 的 排序 方式 设计 为 参数 ， 人 允许 调用 者 动态 指定 ， 这 也 是 一 种 常见 的 设 
计 模 式 ， 称 为 策略 模式 ， 不 同 的 排序 方式 就 是 不 同 的 策略 。 


3. 杏 找 


Arrays 包 含 很 多 与 sort 对 应 的 查找 方法 ， 可 以 在 已 排序 的 数组 中 进 
行 二 分 查找 。 所 谓 二 分 查找 就 是 从 中 间 开 始 查找 ， 如 果 小 于 中 间 元 素 ， 
则 在 前 半 部 分 查找 ， 和 否则 在 后 半 部 分 查找 ， 每 比较 一 次 ， 要 么 找到 ， 要 
么 将 查找 范围 缩小 一 半 ， 所 以 查找 效率 非常 高 。 


二 分 查找 既 可 以 针对 基本 类 型 数组 ， 也 可 以 针对 对 象 数 组 ， 对 对 象 
数组 ， 也 可 以 传递 Comparator， 也 可 以 指定 查找 范围 。 比 如 ， 针 对 int 数 
组 : 




















public static int binarySearch(int[] a, int key) 
public static int binarySearch(int[] a, int fromIndex, int toIndex, int key) 





针对 对 象 数 组 : 





public static int binarySearch(Object[] a, Object key) 





指定 自 定 义 比较 器 : 





public static <T> int binarySearch(T[] a, T key, Comparator<? super T> c) 





如 果 能 找到 ，binarySearch 返 回 找到 的 元 素 索 引 ， 比 如 : 





int[] arr = {3,5,7,13,21}; 
System.out.println(Arrays.binarySearch(arr, 13)); 





输出 为 3。 如 果 没 找到 ， 返 回 一 个 负数 ， 这 个 负数 等 于 -插入 所 





+1) 。 插 入 点 表示 ， 如 果 在 这 个 位 置 插入 没 找到 的 元 素 ， 可 以 保持 原 数 
组 有 序 ， 比 如 : 





int[] arr = {3,5,7,13,21}; 
System,out.println(Arrays,binarySearch(arr，11) )， 





输出 为 -4， 表 示 插 入 点 为 9， 如 果 在 3 这 个 索引 位 置 处 插入 11， 可 以 
保持 数组 有 序 ， 即 数组 会 变 为 13，5，7，11，13，21}。 


需要 注意 的 是 ，binarySearch 针 对 的 必须 是 已 排序 数组 ， 如 果 指 定 
了 Comparator， 需 要 和 排序 时 指定 的 Comparator 保 持 一 致 。 另 外 ， 如 果 
数组 中 有 多 个 匹配 的 元 素 ， 则 返回 哪 一 个 是 不 确定 的 。 
4. 更 多 方法 


除了 常用 的 toString、 排 序 和 查找 ，Arrays 中 还 有 复制 、 比 较 、 批 量 
设置 值 和 计算 哈 希 值 等 方法 。 


基于 原 数 组 ， 复 制 一 个 新 数组 ， 与 toString 一 样 ， 也 有 多 种 重 载 形 
式 ， 例 如 : 








public static long[] copyof(long[] original, int newLength) 
public static <T> T[] copyof(T[] original, int newLength) 





判断 两 个 数组 是 否 相同 ， 支 持 基 本 类 型 和 对 象 类 型 ， 如 下 所 示 : 





public static boolean equals(boolean[] a, boolean[] a2) 
public static boolean equals(Object[] a, Object[] a2) 








只 有 数组 长 度 相同 ， 有 是 每 个 元 素 都 相同 ， 才 返回 true， 否 则 返回 
false。 对 于 对 象 ， 相 同 是 指 equals 返 回 true。 


Arrays 包 含 很 多 fi 方法 ， 可 以 给 数组 中 的 每 个 元 素 设置 一 个 相同 的 
值 : 





public static void fill(int[] a, int val) 





也 可 以 给 数组 中 一 个 给 定 范 围 的 每 个 元 素 设 置 一 个 相同 的 值 : 





public static void fill(int[] a, int fromIndex, int toIndex, int val) 





针对 数组 ， 计 算 一 个 数组 的 哈 希 值 : 





public static int hashCode(int a[]) 





计算 hashCode 的 算法 和 String 是 类 似 的 ， 我 们 看 下 代码 : 





public static int hashCode(int a[]) { 
if(a == null) 
return 0; 
int result = 1; 
for(int element : a) 
result = 31 * result + element ， 
return result; 


} 





回顾 一 下 ，String 计 算 hashCode 的 算法 也 是 类 似 的 ， 数 组 中 的 每 个 
元 了 素 者 位 置 不 同 ， 影 响 也 不 同 ， 使 用 31 一 方面 产生 的 哈 希 
值 更 分 散 ， 另 一 方面 计算 效率 也 比较 高 。 


Java 8 和 9 对 Arrays 类 又 增加 了 一 些 方法 ， 比 如 将 数组 转换 为 流 、 并 
行 排序 、 数 组 比较 每 ， 具 体 可 参看 API 文 档 。 


7.4.2 多维 数组 


之 前 介绍 的 数组 都 是 一 维 的 ， 数 组 还 可 以 是 多 维 的 。 先 来 看 二 维 数 
组 ， i 





int[][] arr = new int[2][3]; 
for(int i=0;i<arr.length;i++){ 
for(int j=0;j<arr[i].length;j++){ 
arr[i][j] = i+j; 





ar 就 是 一 个 一 维 数组 ， 第 一 维 长 度 为 2， 第 二 维 长 度 为 3， 关 似 于 一 
个 矩阵 ， 或 者 类 似 于 一 个 表格 ， 第 一 维 宕 东 行 ， 第 二 维 表示 列 。arr[i 表 
示 第 i 行 ， 它 本 身 还 是 一 个 数组 ，arr[i] 中 表示 第 i 行 中 的 第 j 个 元 素 。 


维 以 上 的 数组 ， 有 几 维 ,就 有 几 个 []]。 证 be 的 后 丰 汶 ， 





int[][][] arr = new int[10][10][10]; 





在 创建 数组 时 ， 除 了 第 一 维 的 长 度 需 要 指定 外 ， 其 他 维 的 长 度 不 需 
甚至 第 一 维 中 每 个 元 素 的 第 二 维 的 长 度 可 以 不 一 样 ， 看 个 例 





int[][] arr = new int[2][]; 
arr[0] = new int[3]; 
arr[1] = new int[5]; 





arr 是 一 个 二 维 数 组 ， 第 一 维 的 长 有 度 为 2， 第 一 个 元 系 的 第 二 维 长 度 
为 3， 而 第 二 个 元 素 的 第 二 维 长 度 为 5。 


多 维 数组 到 底 是 什么 呢 ? 其 实 ， 可 以 认为 ， 多 维 数组 只 是 一 个 假 
象 ， 只 有 一 维 数组 ， 只 是 数组 中 的 每 个 元 素 还 可 以 是 一 个 数组 ， 这 样 
如 果 其 中 每 个 元 素 还 都 是 一 个 数组 ， 那 就 是 三 维 数 
组 。 








Arrays 中 的 toString、equals、hashCode 都 有 对 应 的 针对 多 维 数组 的 
方法 : 





public static String deepToString(Object[] a) 
public static boolean deepEquals(Object[] ai, Object[] a2) 
public static int deepHashCode(Object a[]) 





这 些 deepXXX 方 法 ， 部 会 判断 参数 中 的 元 素 是 否 也 为 数组 ， 如 果 
是 ， 会 递归 进行 操作 。 


看 个 例子 : 





int[][] arr = new int[][]{{9,1},1{2,3,4},1{5,6,7,8}}; 
System.out.println(Arrays.deepToString(arr)); 





输出 为 : 





[[9，1]，[2，3，4]，[5，6，7，8]j 





7.4.3 ”实现 原理 


下 面 介绍 Arrays 的 方法 的 实现 原理 。hashCode() 的 实现 我 们 已 经 
介绍 了 ; f 和 equals 等 的 实现 都 很 简单 ， 循 环 操作 即 可 ， 不 再 歼 述 ， 下 
面 主要 介绍 二 分 查找 和 排序 的 实现 代码 。 

1. 二 分 查找 
二 分 查找 (binarySearch) 的 代码 比较 直接 ， 如 代码 清单 7-3 所 示 。 


代码 清单 7-3 Arrays 的 二 分 查找 实现 





private static <T> int binarySearcho(T[] a, int fromIndex, int toIndex， 
T key, Comparator<? Super T> c) { 
int low = fromIndex; 
int high = toIndex - 1; 
while(low <= high) { 
int mid = (low + high) >>> 1; 
T midVal = a[mid]; 
int cmp = c.compare(midVal, key); 
if(cmp < 0) 
low = mid + 1; 
else if(cmp > 0) 
high = mid - 1; 
else 
return mid; //key found 


} 
return -(low + 1); //key not found 





上 述 代 码 中 有 两 个 标志 : low 和 high， 表 示 查 找 范围 ， 在 while 循 环 
中 ， 与 中 间 值 进行 对 比 ， 大 于 则 在 后 半 部 分 查找 (提高 low)〉 ， 人 否则 在 
前 半 部 分 查找 (降低 high〉。 


2. 排 序 


与 Arrays 中 的 其 他 方法 相 比 ，sort 要 复杂 得 多 。 排 序 是 计算 机 程序 
中 一 个 非常 重要 的 方面 ， 几 十 年 来 ， 计 算 机 科学 家 和 工程 师 们 对 此 进行 
了 大 量 的 研究 ， 设 计 实 现 了 各 种 各 样 的 算法 ， 进 行 了 大 量 的 优化 。 一 般 
而 言 ， 没 有 一 个 最 好 的 算法 ， 不 同 算法 往往 有 不 同 的 适用 场合 。 


那 Arrays 的 sort 是 如 何 实现 的 呢 ? 有 具体 实现 非常 复杂 ， 我 们 简单 了 











解 下 


对 于 基本 类 型 的 数组 ，Java 采 用 的 算法 是 双 枢 轴 快 速 排 序 (Dual- 
Pivot Quicksort) 。 这 个 算法 是 Java 7 引入 的 ， 在 此 之 前 ，Java 采 用 的 算 
法 是 普通 的 快速 排序 。 双 枢 轴 快速 排序 是 对 快速 排序 的 优化 ， 新 算法 的 
实现 代码 位 于 类 java.util.DualPivotQuicksort 中 。 


对 于 对 象 类 型 ，Java 采 用 的 算法 是 TimSort。TimSort 也 是 在 Java 7 引 
入 的 ， 在 此 之 前 ，Java 采 用 的 是 归并 排序 。TimSort 实 际 上 是 对 归并 排序 
的 一 系列 优化 ，TimSort 的 实现 代码 位 于 类 java.util.TimSort 中 。 


在 这 些 排序 算法 中 ， 如 果 数 组 长 度 比 较 小 ， 它 们 还 会 采用 效率 更 高 
的 插入 排序 。 


为 什么 基本 类 型 和 对 象 类 型 的 算法 不 一 样 呢 ? 排序 算法 有 一 个 稳定 
性 的 概念 ， 所 谓 稳 定性 就 是 对 值 相同 的 元 素 ， 如 果 排 序 前 和 排序 后 ， 算 
ee 那 算法 就 是 稳定 的 ， 人 否则 惑 是 不 稳定 


快速 排序 更 快 ， 但 不 稳定 ， 而 归并 排序 是 稳定 的 。 对 于 基本 类 型 ， 
值 相 同 就 是 完全 相同 ， 所 以 稳定 不 稳定 没有 关系 。 但 对 于 对 象 类 型 ， 相 
同 只 是 比较 结果 一 样 ， 它 们 还 是 不 同 的 对 象 ， 其 他 实例 变量 也 不 见得 一 
样 ， 稳 定 不 稳定 可 能 就 很 有 关系 了 ， 所 以 采用 归并 排序 。 


这 些 算 法 的 实现 是 比较 复杂 的 ， 所 过 的 是 ，Java 提 供 了 很 好 的 封 
六， 绝 大 多 数 情 况 下 ， 我 们 会 用 束 可 以 了 。 














FA ,1 


其 实 ，Arrays 中 包含 的 数组 方法 是 比较 少 的 ， 很 多 常用 的 操作 没 
有 ， 比 如 ，Arrays 的 binarySearch 只 能 针对 已 排序 数组 进行 查找 ， 那 没有 


排序 的 数组 怎么 方便 查找 呢 ? 


Apache 有 一 个 开源 包 (http://commons.apache.org/proper/commons- 
lang/ ) ， 里 面 有 一 个 类 ArrayUtils (位 于 包 
org.apache.commons.lang3) ， 包 含 了 更 多 的 常用 数组 操作 ， 这 里 就 不 列 
从。 


数组 是 计算 机 程序 中 的 基本 数据 结构 ，Arrays 类 以 及 ArrayUtils 类 封 
装 了 关于 数组 的 常见 操作 ， 使 用 这 些 方法 ， 避 免 “ 重 新 发 明 轮 子 ? 吧 。 





7.5 剖析 日 期 和 时 间 


本 节 ， 我 们 讨论 Java 中 日 期 和 时 间 处 理 相 关 的 API。 日 期 和 时 间 是 
一 个 比较 复杂 的 概念 ，Java 8 之 前 的 设计 有 一 些 不 足 ， 业 界 有 一 个 广泛 
使 用 的 第 三 方 类 库 Joda-Time，Java 8 受 Joda-Time 影 响 ， 重 新 设计 了 日 期 
和 时 间 API， 新 增 了 一 个 包 java.time。 虽 然 Java 8 之 前 的 API 有 一 些 不 
足 ， 但 依然 是 被 大 量 使 用 的 ， 本 节 只 介绍 Java 8 之 前 的 API。 关 于 Java 8 
的 API， 它 使 用 了 Lambda 表 达 式 ， 我 们 还 没 介 绍 ， 所 以 留待 到 第 26 章 介 


绍 。 





下 面 ， 我 们 先 来 看 一 些 基 本 概念 ， 然 后 再 介绍 Java 的 日 期 和 时 间 
API。 


7.5.1 基本 概念 


， 关于 日 期 和 时 间 ， 有 一 些 基 本 概念 ， 包 括 时 区 、 时 刻 、 纪 元 时 、 年 
历 等 。 


1. 时 区 


我 们 都 知道 ， 同 一 时 刻 ， 世 界 上 各 个 地 区 的 时 间 可 能 是 不 一 样 的 ， 
具体 时 间 与 时 区 有 关 。 全 球 一 共有 24 个 时 区 ， 英 国 格林 尼 治 是 0 时 区 ， 
北京 是 东 八 区 ， 也 就 是 说 格林 尼 治 凌晨 1 点 ， 北 京 是 早上 9 点 。0 时 区 的 
时 间 也 称 为 GMT+0 时 间 ，GMI 是 格林 尼 治 标准 时 间 ， 北 京 的 时 间 就 是 
GMTI+8: 00。 


2. 时 刻 和 纪元 时 

所 有 计算 机 系统 内 部 都 用 一 个 整数 表示 时 刻 ， 这 个 整数 是 距离 格林 
尼 治 标准 时 间 1970 年 1 月 1 日 0 时 0 分 0 秒 的 毫秒 数 。 为 什么 要 用 这 个 时 间 
呢 ? 更 多 的 是 历史 原因 ， 本 书 就 不 介绍 了 。 


格林 尼 治 标准 时 间 1970 年 1 月 1 日 0 时 0 分 0 秒 也 被 称 为 Epoch 
Time《〈 纪 元 时 ) 。 





这 个 整数 表示 的 是 一 个 时 刻 ， 与 时 区 无 关 ， 世 界 上 各 个 地 方 都 是 同 
但 各 个 地 区 对 这 个 时 刻 的 解读 (如 年 月 日 时 分 秒 〉 可 能 是 不 
= 4] 。 


对 于 1970 年 以 前 的 时 间 ， 使 用 负数 表示 。 
3 年 历 


我 们 都 知道 ， 中 国有 公历 和 农历 之 分 ， 公 历 和 农历 都 是 年 历 ， 不 同 
的 年 历 ， 一 年 有 多 少 月 ， 每 月 有 多 少 天 ， 基 至 一 天 有 多 少 小 时 ， 这 些 可 
能 都 是 不 一 样 的 。 


比如 ， 公 历 有 疾 年 ， 国 年 2 月 是 29 天 ， 而 其 他 年 份 则 是 28 天 ， 其 他 
月 份 ， 有 的 是 30 天 ， 有 的 是 31 天 。 农 历 有 上 半月， 比如 头 7 月 ， 一 年 就 会 
有 两 个 7 月 ， 一 共 13 个 月 。 


公历 是 世界 上 广泛 采用 的 年 历 ， 除 了 公历 ， 还 有 其 他 一 些 年 历 ， 比 
如 日 本 也 有 目 己 的 年 历 。Java API 的 设计 思想 是 支持 国际 化 的 ， 文 持 多 
种 年 历 ， 但 没有 直接 支持 中 国 的 农历 ， 本 书 主要 讨论 公历 。 


简单 总 结 下 ， 时 刻 是 一 个 绝对 时 间 ， 对 时 刻 的 解读 ， 则 是 相对 的 ， 
与 年 历 和 时 区 相关 。 























7.5.2 ”日 期 和 时 间 APIi 


Java API 中 关于 日 期 和 时 间 ， 有 三 个 主要 的 类 。 
:Date: 表示 时 刻 ， 即 绝对 时 间 ， 与 年 月 日 无 关 。 


Calendar: 表示 年 历 ，Calendar 是 一 个 抽象 类 ， 其 中 表示 公历 的 子 
类 是 Gregorian-Calendar。 


.DateFormat: 表示 格式 化 ， 能 够 将 日 期 和 时 间 与 字符 串 进行 相互 转 
换 ，DateFormat 也 是 一 个 抽象 类 ， 其 中 最 常用 的 子 类 是 
SimpleDateFormat。 


还 有 两 个 相关 的 类 : 








TimeZone: 表示 时 区 。 
.Locale: 表示 国家 《或 地 区 ) 和 语言 。 
下 面 ， 我 们 来 看 这 些 类 。 

1.Date 


Date 是 Java API 中 最 早 引 入 的 关于 日 期 的 类 ， 一 开始 ，Date 也 承载 
了 关于 年 历 的 角色 ， 但 由 于 不 能 支持 国际 化 ， 其 中 的 很 多 方法 都 已 经 过 
时 了 ， 被 标记 为 了 @Deprecated， 不 再 建议 使 用 。 


Date 表 示 时 刻 ， 内 部 主要 是 一 个 long 类 型 的 值 ， 如 下 所 示 : 








private transient long fastTime; 








fastTime 表 示 距 离 纪 元 时 的 军 秒 数 ， 此 处 ， 关 于 transient 关 键 字 ， 我 
们 暂时 忽略 。 


Date 有 两 个 构造 方法 : 





public Date(long date) { 
fastTime = date; 


} 
public Date() { 
this(System.currentTimeMillis()); 








第 一 个 构造 方法 是 根据 传 入 的 蝶 秒 数 进行 初始 化 ;第 二 个 构造 方法 
是 默认 构造 方法 ， 它 根据 System.currentTimeMillis () 的 返回 值 进行 和 
始 化 。System.currentTimeMillis () 是 一 个 常用 的 方法 ， 它 返回 当前 时 
刻 距 离 纪 元 时 的 毫秒 数 。 


Pate I A 方法 都 已 经 过 时 了 ， 其 中 没有 过 时 的 主要 方法 有 下 
面 这 些 

















public long getTime() // 返 回 毫秒 数 
public boolean equals(0bject obj) // 主 要 就 是 比较 内 部 的 毫秒 数 是 否 相 同 
// 与 其 他 Date 进 行 比较 , 如 果 当 前 Date 的 毫秒 数 小 于 参数 中 的 返回 -1， 相 同 返 回 9， 否 则 返回 1 



























































public int compareTo(Date anotherDate ) 

public boolean before(Date when) // 判 断 是 否 在 给 定 日 期 之 前 
public boolean after(Date when) // 判 断 是 否 在 给 定 日 期 之 后 
public int hashCode() // 哈 希 值 算法 与 Long 类 似 






































2.TimeZone 


TimeZone 表 示 时 区 ， 它 是 一 个 抽象 类 ， 有 静态 方法 用 于 获取 其 实 
例 。 获 取 当 前 的 默认 时 区 ， 代 码 为 : 





TimeZone tz = TimeZone.getDefault(); 
System,out.println(tz.getID())， 





获取 默认 时 区 ， 并 输出 其 ID， 在 笔者 的 计算 机 中 ， 输 出 为 : 





Asia/Shanghai 








默认 时 区 是 在 哪里 设置 的 呢 ? 可 以 更 改 吗 ? Java 中 有 一 个 系统 属性 
user.timezone， 保 存 的 就 是 默认 时 区 。 系 统 属性 可 以 通过 
System.getProperty 获 得 ， 如 下 所 示 : 





System,out.println(System,.getProperty("user ,timezone") ) ， 





在 笔者 的 计算 机 中 ， 输 出 为 : 





Asia/Shanghai 





系统 属性 可 以 在 Java 启 动 的 时 候 传 入 参数 进行 更 改 ， 如 : 





java -Duser.timezone=Asia/Shanghai xxxx 





TimeZone 也 有 静态 方法 ， 可 以 获得 任意 给 定时 区 的 实例 。 比 如 ， 获 
取 美 国 东部 时 区 : 





TimeZone tz = TimeZone.getTimeZone("US/Eastern"); 





ID 除了 可 以 是 名 称 外 ， 还 可 以 是 GMT 形 式 表示 的 时 区 ， 如 : 





TimeZone tz = TimeZone.getTimeZone("GMT+08:00"); 





3.Locale 


Locale 表 示 国 家 《或 地 区 ) 和 语言 ， 它 有 两 个 主要 参数 : 一 个 是 国 
家 (或 地 区 ) ， 另 一 个 是 语言 ， 每 个 参数 都 有 一 个 代码 ， 不 过 国家 (或 
地 区 ) 并 不 是 必需 的 。 比 如 ， 中 国内 地 的 代码 是 CN， 中 国 台湾 地 区 的 
代码 是 TW， 美 国 的 代码 是 US， 中 文 语言 的 代码 是 zh， 英 文 语言 的 代码 


是 en。 


Locale 类 中 定义 了 一 些 静 态 变 量 ， 表 示 稼 见 的 Locale， 比 如 : 











.Locale.US: 表示 美国 英语 。 

-Locale.ENGLISH: 表示 所 有 英语 。 

:Locale.TAIWAN: 表示 中 国 台 湾 地 区 所 用 的 中 文 。 
.Locale.CHINESE: 表示 所 有 中 文 。 
:Locale.SIMPLIFIED_CHINESE: 表示 中 国内 地 所 用 的 中 文 。 


与 TimeZone 类 似 ，Locale 也 有 静态 方法 获取 默认 值 ， 如 : 








Locale locale = Locale.getDefault(); 
System,.out.println(locale.toString( )); 





在 笔者 的 计算 机 中 ， 输 出 为 : 





zh_CN 





4.Calendar 





Calendar 类 是 日 期 和 时 间 操 作 中 的 主要 类 ， 它 表示 与 TimeZone 和 
Locale 相 关 的 日 历 信 息 ， 可 以 进行 各 种 相关 的 运算 。 我 们 先 来 看 下 它 的 
与 Date 类 似 ，Calendar 内 部 也 有 一 个 表示 时 刻 的 旦 秒 数 ， 定 
义 为 : 











protected long time; 





除 此 之 外 ，Calendar 内 部 还 有 一 个 数组 ， 表 示 日 历 中 各 个 字段 的 
值 ， 定 义 为 : 





protected int fields[]; 





这 个 数组 的 长 度 为 17， 保 存 一 个 日 期 中 各 个 字段 的 值 ， 都 有 哪些 字 
段 呢 ? Calendar 类 中 定义 了 一 些 静态 变量 ， 表 示 这 些 字段 ， 主 要 有 : 


Calendar.YEAR: 表示 年 。 











:Calendar.MONTH: 表示 月 ，1 月 是 0，Calendar 同 样 定义 了 表示 各 
个 月 份 的 静态 变量 ， 如 Calendar.JULY 表 示 7 月 。 


Calendar.DAY_ OF MONTH: 表示 日 ， 每 月 的 第 一 天 是 1。 





Calendar.HOUR_OF DAY: 表示 小 时 ， 为 0 一 23。 
Calendar.MINUTE :， 表示 分 钟 ， 为 0 一 59。 
Calendar.SECOND: 表示 秒 ， 为 0 一 59。 


.Calendar.MILLISECOND: 表示 毫秒 ， 为 0 一 999。 








Calendar.DAY_OF_ WEEK:， 表示 星期 几 ， 周 日 是 1， 周 一 是 2， 周 
六 是 7，Calenar 同 样 定义 了 表示 各 个 星期 的 静态 变量 ， 如 
Calendar.SUNDAY 表 示 周 日 。 


Calendar 是 抽象 类 ， 不 能 直接 创建 对 象 ， 它 提供 了 多 个 静态 方法 ， 
可 以 获取 Calendar 实 例 ， 比 如 : 





public static Calendar getInstance() 
public static Calendar getInstance(TimeZone zone, Locale aLocale) 





最 终 调用 的 方法 都 是 需要 TimeZone 和 和 Locale 的 ， 如 果 没 有 ， 则 会 使 
用 上 面 介绍 的 默认 值 。getInstance 方 法 会 根据 TimeZone 和 Locale 创 建 对 
应 的 Calendar 子 类 对 象 ， 在 中 文系 统 中 ， 子 类 一 般 是 表示 公历 的 


GregorianCalendar。 





getInstance 方 法 封装 了 Calendar 对 象 创建 的 细节 。TimeZone 和 Locale 
不 同 ， 具 体 的 子 类 可 能 不 同 ， 但 都 是 Calendar。 这 种 隐藏 对 象 创建 细节 
的 方式 ， 是 计算 机 程序 中 一 种 第 见 的 设计 模式 ， 它 有 一 个 名 字 ， 叫 工矿 
方法 ，getInstance 就 是 一 个 工厂 方法 ， 它 生产 对 象 。 

与 new Date () 类 似 ， 新 创建 的 Calendar 对 象 表示 的 也 是 当前 时 


间 ， 与 Date 不 同 的 是 ，Calendar 对 象 可 以 方便 地 获取 年 月 日 等 日 历 信 
妃 。 来 看 代码 ， 输 出 当前 时 间 的 各 种 信息 : 








Calendar calendar = Calendar .getInstance( ) ; 

System,out.println("year: "+Ccalendar ,get(Calendar .YEAR) ) ， 
System,out.println("month: "+calendar.get(Calendar .MONTH)); 
System.out.println("day: "+calendar.get(Calendar.DAY_OF_MONTH)); 
System,out.println("hour: "+calendar .get(Calendar .HOUR_OF_DAY ) ) ， 
System,out.println("minute: "+calendar.get(Calendar ,MINUTE ) ) ， 
System.out.println("second: "+calendar ,get(Calendar ,SECOND ) ) ; 
System.out.println("millisecond: ”+calendar .get(Calendar .MILLISECOND ) ) ; 
System.out.println("day_of week: " + calendar.get(Calendar.DAY_OF_WEEK)); 





具体 输出 与 执行 时 的 时 间 和 上 默认 的 TimeZone 以 及 Locale 有 关 ， 比 
如 ， 在 笔者 的 计算 机 中 的 一 次 输出 为 : 





year: 2016 
month: 7 

day: 14 

hour: 13 

minute: 55 
second: 51 
millisecond: 564 
day_of_week: 2 





内 部 ，Calendar 会 将 表示 时 刻 的 毫秒 数 ， 按 照 TimeZone 和 Locale 对 
应 的 年 历 ， 计 算 各 个 日 历 字 段 的 值 ， 存 放 在 fields 数 组 中 ，Calendar.get 
方法 获取 的 就 是 fields 数 组 中 对 应 字段 的 值 。 








Calendar 支 持 根 据 Date 或 毫秒 数 设 置 时 间 : 





public final void setTime(Date date) 
public void setTimeINnMillis(long millis) 








也 支持 根据 年 月 日 等 日 历 字 段 设 置 时 间 ， 比 如 : 





public final void set(int year, int month, int date) 
public final void set(int year, int month, int date, 
int hourofDay, int minute, int second) 

public void set(int field, int value) 





除了 下 接 设置 ，Calendar 文 持 根据 字段 增加 和 减少 时 间 : 





public void add(int field, int amount ) 





amount 为 正 数 表 示 增 加 ， 负 数 表 示 减 少 。 
比如 ， 如 果 想 设置 Calendar 为 第 二 天 的 下 午 2 点 15， 代 码 可 以 为 : 





Calendar calendar = Calendar .getInstance(); 
calendar .add(Calendar .DAY_OF_MONTH, 1); 
calendar.set(Calendar .HOUR_ OF_DAY, 14); 
calendar .set(Calendar .MINUTE, 15); 
calendar.set(Calendar .SECOND, 0); 

calendar .set(Calendar .MILLISECOND, 0); 





Calendar 的 这 些 方法 中 一 个 比较 方便 和 强大 的 地 方 在 于 ， 它 能 够 自 
动 调整 相关 的 字段 。 比 如 ， 我 们 知道 2 月 最 多 有 29 天 ， 如 果 当 前 时 间 为 1 
月 30 号 ， 对 Calendar.MONTH 字 段 加 1， 即 增加 一 月 ，Calendar 不 是 简单 
的 只 对 月 字段 加 1， 那 样 日 期 是 2 月 30 号 ， 是 无 效 的 ，Calendar 会 自动 调 
整 为 2 月 最 后 一 天 ， 即 2 月 28 日 或 29 日 。 


再 如 ， 设 置 的 值 可 以 超出 其 字段 最 大 范 围 ，Calendar 会 自动 更 新 其 
他 字段 ， 如 : 














Calendar calendar = Calendar .getInstance( ) ; 
calendar ,add(Calendar ,HOUR_OF_DAY，48 ) ; 
calendar ,add(Calendar ,MINUTE， -120); 





相当 于 增加 了 46 小 时 。 


内 部 ， 根 据 字段 设置 或 修改 时 间 时 ，Calendar 会 更 新 fields 数 组 对 应 
字段 的 值 ， 但 一 般 不 会 立即 更 新 其 他 相关 字段 或 内 部 的 宣 秒 数 的 值 ， 不 
过 在 获取 时 间或 字段 值 的 时 候 ，Calendar 会 重新 计算 并 更 新 相关 字段 。 

简单 总 结 下 ，Calenar 做 了 一 项 非常 烦 开 的 工作 ， 根 据 TimeZone 和 
Locale， 在 绝对 时 间 塞 秒 数 和 日 历 字 段 之 间 目 动 进行 转换 ， 且 对 不 同日 
历 字 段 的 修改 进行 目 动 同步 更 新 。 


除了 add 方 法 ，Calendar 还 有 一 个 类 似 的 方法 : 

















public void roll(int field, int amount ) 





, 与 add 方 法 的 区 别 是 ，roll 方 法 不 影响 时 间 范 围 更 大 的 字段 值 。 比 
中 





Calendar calendar = Calendar .getInstance( ) ; 
calendar ,set(Calendar ,HOUR_OF_DAY，13) ; 
calendar ,set(Calendar ,MINUTE， 59); 

calendar ,add(Calendar .MINUTE, 3); 





calendar 首 先 设置 为 13: 59， 然 后 分 钟 字段 加 3， 执 行 后 的 calendar 
时 间 为 14: 02。 如 果 add 改 为 roll， 即 : 





calendar .roll(Calendar .MINUTE, 3); 





则 执行 后 的 calendar 时 间 会 变 为 13: 02， 在 分 钟 字 段 上 执行 roll 方 法 
不 会 改变 小 时 的 值 。 


Calendar 可 以 方便 地 转换 为 Date 或 蝇 秒 数 ， 方 法 是 : 





public final Date getTime() 
public long getTimeINMillis() 





与 Date 类 似 ，Calendar 之 间 也 可 以 进行 比较 ， 也 实现 了 Comparable 
接口 ， 相 关 方 法 有 : 





public boolean equals(Object obj ) 

public int compareTo(Calendar anotherCalendar ) 
public boolean after(Object when) 

public boolean before(Object when) 





5.DateFormat 





DateFormat 类 主要 在 Date 和 字符 串 表示 之 间 进 行 相互 转换 ， 它 有 两 
个 主要 的 方法 : 





public final String format(Date date) 
public Date parse(String source) 





format 将 Date 转 换 为 字符 串 ，parse 将 字符 串 转 换 为 Date。 


Date 的 字符 串 表 示 与 TimeZone 和 Locale 都 是 相关 的 ， 除 此 之 外 ， 还 
与 两 个 格式 化 风格 有 关 ， 一 个 是 日 期 的 格式 化 风格 ， 另 一 个 是 时 间 的 格 
式 化 风格 。DateFormat 定 义 了 4 个 静态 变量 ， 表 示 4 种 风格 : SHORT、 
MEDIUM、LONG 和 FULL; 还 定义 了 一 个 静态 变量 DEFAULT， 表 示 默 
认 风 格 ， 值 为 MEDIUM， 不 同 风格 输出 的 信息 详细 程度 不 同 。 


与 Calendar 类 似 ，DateFormat 也 是 抽象 类 ， 也 用 工厂 方法 创建 对 
象 ， 提 供 了 多 个 静态 方法 创建 DateFormat 对 象 ， 有 三 类 方法 : 








public final static DateFormat getDateTimeInstance() 
public final static DateFormat getDateInstance() 
public final static DateFormat getTimeInstance() 





getDateTimeInstance 方 法 既 处 理 日 期 也 处 理 时 间 ，getDateInstance 方 
法 只 处 理 日 期 ，get-TimeInstance 方 法 只 处 理 时 间 。 看 下 面 的 代码 : 





Calendar calendar = Calendar .getInstance( ) ; 

//2016-08-15 14:15:20 

calendar.set(2016, 07, 15, 14, 15, 20); 

System,out.println(DateFormat ,getDateTimeInstance() 
.format(calendar .getTime())); 


System,out.println(DateFormat .getDateInstance( ) 
.format(calendar .getTime())); 

System,out.println(DateFormat .getTimeInstance( ) 
.format(calendar .getTime())); 





输出 为 : 





2016-8-15 14:15:20 
2016-8-15 
14:15:20 





每 类 工厂 方法 都 有 两 个 重 载 的 方法 ， 接 受 日 斯 和 时 间 风 格 以 及 
Locale 作 为 参数 : 





DateFormat getDateTimeInstance(int dateStyle, int timeStyle) 
DateFormat getDateTimeInstance(int dateStyle, int timeStyle, Locale aLocale) 





比如 ， 看 下 面 的 代码 : 





Calendar calendar = Calendar .getInstance(); 

//2016-08-15 14:15:20 

calendar.set(2016, 07, 15, 14, 15, 20); 

System,out.println(DateFormat .getDateTimeInstance(DateFormat .LONG， 
DateFormat .SHORT, Locale.CHINESE).format(calendar.getTime())); 





输出 为 : 











2016 年 8 月 15 日 下 午 2:15 

















DateFormat 的 工矿 方法 里 ， 我 们 没 看 到 TimeZone 参 数 ， 不 过 ， 
DateFormat 提 供 了 一 个 setter 方 法 ， 可 以 设置 TimeZone: 





public void setTimeZone(TimeZone zone) 





DateFormat 虽 然 比 较 方 便 ， 但 如 果 我 们 要 对 字符 串 格 式 有 更 精确 的 
控制 ， 则 应 该 使 用 SimpleDateFormat 这 个 类 。 


6.SimpleDateFormat 


SimpleDateFormat 是 DateFormat 的 子 类 ， 相 比 DateFormat， 它 的 一 个 
主要 不 同 是 ， 它 可 以 接受 一 个 自 定 义 的 模式 (pattern)〉 作为 参数 ， 这 个 
模式 规定 了 Date 的 字符 串 形式 。 先 看 个 例子 : 





Calendar calendar = Calendar .getInstance(); 

//2016-08-15 14:15:20 

calendar.set(2016, 07, 15, 14, 15, 20); 

SimpleDateFormat sdf = new SimpleDateFormat( 
"yyyy 年 MM 月 dd 日 E HH 时 mm 分 Ss 秒 " ) ， 

System,out.println(sdf.format(calendar .getTime())); 























输出 为 : 























2016 年 08 月 15 日 星期 一 14 时 15 分 20 秒 














SimpleDateFormat 有 个 构造 方法 ， 可 以 接受 一 个 pattem 作 为 参数 ， 
这 里 pattern 是 : 








yyyy 年 MM 月 dd 日 E HH 时 mm 分 ss 秒 








pattern 中 的 英文 字符 a 一 z 和 A 一 2 表示 特 殊 含 义 ， 其 他 字符 原样 输 
出 ， 这 里 : 


:yyyy: 表示 4 位 的 年 。 

"MM: 表示 月 ， 用 两 位 数 表示 。 

“dd: 表示 日 ， 用 两 位 数 表 示 。 

HH: 表示 24 小 时 制 的 小 时 数 ， 用 两 位 数 表示 。 
-mm: 表示 分 钟 ， 用 两 位 数 表示 。 

“ss: 表示 秒 ， 用 两 位 数 表示 。 


EE: 表示 星期 几 。 


这 里 需要 特意 提醒 一 下 ，hh 也 表示 小 时 数 ， 但 表示 的 是 12 小 时 制 的 
小 时 数 ， 而 a 表 示 的 是 上 午 还 是 下 午 ， 看 代码 : 











Calendar calendar = Calendar .getInstance( ) ; 

//2016-08-15 14:15:20 

calendar.set(2016, 07, 15, 14, 15, 20); 

SimpleDateFormat sdf = new SimpleDateFormat("yyyy/MM/dd hh:mm:ss a"); 
System,out.println(sdf.format(calendar .getTime())); 





输出 为 : 





2016/08/15 02:15:20 下 午 





更 多 的 特殊 含义 可 以 参看 SimpleDateFormat 的 API 文 档 。 如 果 想 原 
样 输出 英文 字符 ， 可 以 将 其 用 单 引号 括 起 来 。 


除了 将 Date 转 换 为 字符 串 ，SimpleDateFormat 也 可 以 方便 地 将 字符 
串 转 化 为 Date， 看 代码 : 





String str = "2016-08-15 14:15:20.456"; 
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss.SSS"); 
try { 
Date date = sdf.parse(str); 
SimpleDateFormat sdf2 = new SimpleDateFormat("yyyy 年 M 有 Hd h:m:s.S a"); 
System,out.println(sdf2.format(date) )， 
} catch (ParseException e) { 
e.printStackTrace( ); 




















输出 为 : 





2016 年 8 月 15 2:15:20.456 下 午 








代码 将 字符 串 解 析 为 了 一 个 Date 对 象 ， 然 后 使 用 另外 一 个 格式 进行 
了 输出 ， 位 的 毫秒 数 。 需 要 注意 的 是 ，parse 会 抛 出 一 个 
受 检 有 异常 ， 异 常 类 型 为 ParseException， 调 用 者 必须 进行 处 理 。 








7.5.3 局限 性 


至 此 ， 关 于 Java 8 之 前 的 日 斯 和 时 间 相关 API 的 主要 内 容 基本 束 介 绍 
完了 。Date 表 示 时 刻 ， 与 年 月 日 无 关 ，Calendar 表 示 日 历 ， 与 时 区 和 
Locale 相 关 ， 可 进行 各 种 运算 ， 是 日 期 时 间 操 作 的 主要 类 ， 
DateFormat/SimpleDateFormat 在 Date 和 字符 串 之 间 进 行 相互 转换 。 这 些 
API 存 在 着 一 些 局 限 性 ， 下 面 强调 一 下 。 


1.Date 中 的 过 时 方法 


Date 中 的 方法 参数 与 第 识 不 符合 ， 过 时 方法 标记 容易 被 人 忽略 ， 产 
生 误 用 。 比 如 ， 看 如 下 代码 : 








Date date = new Date(2016,8,15); 
System.out.println(DateFormat.getDateInstance().format(date)); 





想当然 的 输出 为 2016-08-15， 但 其 实 输出 为 : 





3916-9-15 





之 所 以 产生 这 个 输出 ， 是 因为 Date 构 造 方法 中 的 year 表 示 的 是 与 
1900 年 的 差 ，month 是 从 0 开始 的 。 


2.Calendar 操 作 比 较 烦 珊 


Calendar API 的 设计 不 是 很 成 功 ， 一 些 简单 的 操作 都 需要 多 次 方法 
调用 ， 与 很 多 代码 ， 比 较 腑 肿 。 


另外 ，Calendar 难 以 进行 比较 复杂 的 日 期 操作 ， 比 如 ， 计 算 两 个 日 
期 之 间 有 多 少 个 月 ， 根 据 生 日 计算 年 龄 ， 计 算 下 个 月 的 第 一 个 周一 等 。 


3.DateFormat 的 线程 安全 性 





DateFormat/SimpleDateFormat 不 是 线程 安全 的 。 关 于 线程 概念 ， 第 
15 章 会 详细 介绍 ， 这 里 简单 说 明 一 下 。 多 个 线程 同时 使 用 一 个 
DateFormat 实 例 的 时 候 ， 会 有 问题 ， 因 为 DateFormat 内 部 使 用 了 一 个 
Calendar 实 例 对 象 ， 多 线程 同时 调用 的 时 候 ， 这 个 Calendar 实 例 的 状态 
可 能 就 会 紊乱 。 


解决 这 个 问题 大 概 有 以 下 方案 : 
:每 次 使 用 DateFormat 都 新 建 一 个 对 象 。 
-使 用 线程 同步 (第 15 章 介绍 ) 。 


:使 用 ThreadLocal (第 19 章 介绍 )〉 。 





.使 用 Joda-Time 或 Java 8 的 API， 它 们 是 线程 安全 的 。 


7.6 ”随机 


0 
求 ， 上 0: 


各 种 游戏 中 有 大 量 的 随机 ， 比 如 扑克 游戏 中 的 洗 牌 。 

- 微 信 抢 红 包 ， 抢 的 红包 人 金额 是 随机 的 。 

北京 购车 摇号 ， 谁 能 摇 到 是 随机 的 。 

“给 用 户 生 成 随机 密码 。 

我 们 首先 来 介绍 Java 对 随机 的 支持 ， 同 时 介绍 其 实现 原理 ， 然 后 针 


对 一 些 实际 场景 ， 包 括 洗 牌 、 抢 红包 、 摇 号 、 随 机 高 强度 密码 、 带 权重 
的 随机 选择 等 ， 讨 论 如 何 应 用 随机 。 先 来 看 如 何 使 用 最 基本 的 随机 。 


7.6.1] Math.random 





Java 中 ， 对 随机 最 基本 的 支持 是 Math 类 中 的 静态 方法 random () ， 
它 生成 一 个 0 一 1 的 随机 数 ， 类 型 为 double， 包 括 0 但 不 包括 1。 比 如 ， 随 
机 生成 并 输出 3 个 数 : 


for(int i=0;i<3;i++) 
System.out.println(Math.random( )); 





笔者 的 计算 机 中 的 一 次 运行 ， 输 出 为 : 


0.4784896133823269 
0.03012515628333423 
0.7921024363953197 


每 次 运行 ， 输 出 都 不 一 样 。Math.random () 是 如 何 实现 的 呢 ? 我 
们 来 看 相关 代码 (Java7) : 


有 一 


private static Random randomNumberGenerator 
private static synchronized Random initRNG() { 
Random rnd = randomNumberGenerator; 
return (rnd == null) ? (randomNumberGenerator = new Random()) : rnd; 


public static double random() { 
Random rnd = randomNumberGenerator; 
if (rnd == null) rnd = initRNG(); 
return rnd.nextDouble(); 





内 部 它 使 用 了 一 个 Random 类 型 的 静态 变量 
randomNumberGenerator， 调 用 random () 就 是 调用 该 变量 的 
nextDouble 〈) 方法 ， 这 个 Random 变 量 只 有 在 第 一 次 使 用 的 时 候 才 创 
建 。 


下 面 我 们 来 看 这 个 Random 类 ， 它 位 于 包 java.util 下 。 
7.6.2 Random 


Random 类 提供 了 更 为 丰富 的 随机 方法 ， 它 的 方法 不 是 静态 方法 ， 
使 用 Random， 先 要 创建 一 个 Random 实 例 ， 看 个 例子 : 





Random rnd = new Random(); 
System.out.println(rnd.nextInt()); 
System.out.println(rnd.nextInt(100)); 





笔者 计算 机 中 的 一 次 运行 ， 输 出 为 : 





-1516612608 
23 





nextInt ( ) 产生 一 个 随机 的 int， 可 能 为 正 数 ， 也 可 能 为 负数 ， 
nextInt (100) 产生 一 个 随机 int， 范 围 是 0 一 100， 包 括 0 不 包括 100。 除 
了 nextmt， 还 有 一 些 别 的 方法 : 





public long nextLong() // 随 机 生成 一 个 long 

public boolean nextBoolean() // 随 机 生成 一 个 boolean 

public void nextBytes(byte[] bytes) // 产 生 随机 字 节 ， 字 节 个 数 就 是 bytes 的 长 度 
public float nextFloat() // 随 机 浮 点 数 ， 从 0 到 1， 包 括 0 不 包括 1 




















public double nextDouble() // 随 机 浮 点 数 ， 从 0 到 1， 包 括 0 不 包括 1 





除了 默认 构造 方法 ，Random 类 还 有 一 个 构造 方法 ， 可 以 接受 一 个 
long 类 型 的 种 子 参 数 : 


public Random(long seed) 


种 子 决 定 了 随机 产生 的 序列 ， 种 子 相 同 ， 产 生 的 随机 数 序列 就 是 相 
同 的 。 看 个 例子 : 


Random rnd = new Random(20160824 ) ; 

for(int i=0;i<5;i++) 
System.out.print(rnd.nextInt(100)+" "); 

} 


种 子 为 20160824， 产 生 5 个 0 一 100 的 随机 数 ， 输 出 为 : 


69 13 13 94 50 





这 个 程序 无 论 执行 多 少 裔 ， 在 哪 执行 ， 输 出 结果 都 是 相同 的 。 
除了 在 构造 方法 中 指定 种 子 ，Random 类 还 有 一 个 setter 实 例 方 法 : 





synchronized public void setSeed(long seed) 








其 效果 与 在 构造 方法 中 指定 种 子 是 一 样 的 。 


为 什么 要 指定 种 子 呢 ? 指定 种 子 还 是 真正 的 随机 吗 ? 指定 种 子 是 为 
了 实现 可 重复 的 随机 。 比如 用 于 模拟 测试 程序 中 ， 模 拟 要求 随 机 ， 但 
测试 要 求 可 重复 。 在 北京 购车 摇号 程序 中 ， 种 子 也 是 指定 的 ， 后 面 我 们 
还 会 介绍 。 种 子 到 底 扮演 了 什么 角色 呢 ? 随 机 到 底 是 如 何 产 生 的 呢 ? 让 
我 们 看 下 随机 的 基本 原理 。 

















7.6.3 ”随机 的 基本 原理 


Random 产 生 的 随机 数 不 是 真正 的 随机 数 ， 相 反 ， 它 产生 的 随机 数 
一 般 称 为 伪 随 机 数 。 真正 的 随机 数 比较 难以 产生 ， 计 算 机 程序 中 的 随 
机 数 一 般 都 是 伪 随 机 数 。 


伪 随 机 数 都 是 基于 一 个 种 子 数 的 ， 然 后 每 需要 一 个 随机 数 ， 都 是 对 
当前 种 子 进行 一 些 数学 运算 ， 得 到 一 个 数 ， 基 于 这 个 数 得 到 需要 的 随机 
数 和 新 的 种 子 。 


数学 运算 是 固定 的 ， 所 以 种 子 确定 后 ， 产 生 的 随机 数 序列 就 是 确定 
的 ， 确 定 的 数字 序列 当然 不 是 真正 的 随机 数 ， 但 种 子 不 同 ， 序 列 就 不 
人 所 以 称 之 为 伪 随 
儿 数 。 


Random 的 默认 构造 方法 中 没有 传递 种 子 ， 它 会 自动 生成 一 个 种 
子 ， 这 个 种 子 数 是 一 个 真正 的 随机 数 ， 如 下 所 示 (Java 7) : 

















private static final AtomicLong seedUniquifier 
= New AtomicLong(8682522807148012L ); 

public Random 
this(seedUniquifier() ^ System.nanoTime()); 


private static long seedUniquifier() { 
for(;;) { 
long current = seedUniquifier.get(); 
long next = current * 181783497276652981L; 
if(seedUniquifier.compareAndSet(current, next)) 
return next; 





种 子 是 seedUniquifier ( ) 与 System.nanoTime〈() 按 位 异 或 的 结果 ， 
System.nanoTime〈) 返回 一 个 更 高 精度 《〈 纳 秒 ) 的 当前 时 间 ， 
seedUniquifier () 里 面 的 代码 涉及 一 些 多 线程 相关 的 知识 ， 我 们 后 续 章 
节 再 介绍 ， 简 单 地 说 ， 就 是 返回 当前 seedUniquifier (current 变 量 ) 与 一 
个 常数 181783497276652981L 相 乘 的 结果 (next 变 量 ) ， 然 后 ， 设 置 
seedUniquifier 的 值 为 next， 使 用 循环 和 compareAndSet 都 是 为 了 确保 在 多 
线程 的 环境 下 不 会 有 两 次 调用 返回 相同 的 值 ， 保 证 随机 性 。 


有 了 种 子 数 之 后 ， 其 他 数 是 怎么 生成 的 呢 ? 我 们 来 看 一 些 代 码 : 





public int nextInt() { 
return next(32) 


public long nextLong() { 
return ((long)(next(32)) << 32) + next(32); 


public float nextFloat() { 
return next(24) / ((float)(1 << 24)); 


} 

public boolean nextBoolean() { 
return next(1) != 0; 

} 





它们 都 调用 了 next (int bits) ， 生 成 指定 位 数 的 随机 数 ， 我 们 来 看 
下 它 的 代码 ; 





private static final long multiplier = Ox5DEECE66DL; 
private static final long addend = OxBL; 
private static final long mask = (1L << 48) - 1; 
protected int next(int bits) { 
long oldseed, nextseed; 
AtomicLong seed = this,seed ; 
do { 
oldseed = seed.get(); 
nextseed = (oldseed * multiplier + addend) & mask; 
} while (!seed.compareAndSet(oldseed, nextseed)); 
return (int)(nextseed >>> (48 - bits)); 





简单 地 说 ， 就 是 使 用 了 如 下 公式 : 





nextseed = (oldseed * multiplier + addend) & mask 





上 日 的 种 子 (oldseed) 乘 以 一 个 数 multiplier) ， 加 上 一 个 数 
addend， 然 后 取 低 48 位 作为 结果 (mask 相 与 )。 


为 什么 采用 这 个 方法 ?这 个 方法 为 什么 可 以 产生 随机 数 ? 这 个 方法 
的 名 称 叫 线性 同 余 随 机 数 生成 器 (linear congruential pseudorandom 
number generator) ， 描 述 在 《计算 机 程序 设计 艺术 》 一 书 中 。 随 机 的 理 
论 是 一 个 比较 复杂 的 话题 ， 超 出 了 本 书 的 范畴 ， 我 们 就 不 讨论 了 。 


我 们 需要 知道 的 基本 原理 是 : 随机 数 基 于 一 个 种 子 ， 种 子 固定 ， 随 
机 数 序列 就 固定 ， 默 认 构 造 方法 中 ， 种 子 是 一 个 真正 的 随机 数 。 


理解 了 随机 的 基本 概念 和 原理 ， 我 们 来 看 一 些 应 用 场景 ， 包 括 随 机 
密码 、 洗 牌 、 带 权重 的 随机 选择 、 微 信 抢 红包 算法 ， 以 及 北京 购车 播 号 





算法 。 
7.6.4 ”随机 密码 

在 给 用 户 生成 账号 时 ， 经 常 需要 给 用 户 生成 一 个 默认 随机 密码 ， 然 
后 通过 邮件 或 短信 发 给 用 户 ， 作 为 初次 登录 使 用 。 我 们 假定 密码 是 6 位 
数字 ， 代 码 很 简单 ， 如 代码 清单 7-4 所 示 。 

代码 清单 7-4 生成 随机 密码 : 6 位 数字 








public static String randomPassword(){ 
char[] chars = new char[6]; 
Random rnd = new Random(); 
for(int i=0; i<6; i++){ 
chars[i] = (char)('0'+rnd.nextInt(10)); 


return new String(chars); 





代码 很 简单 ， 就 不 解释 了 。 如 果 要 求 是 8 位 密码 ， 字 符 可 能 由 大 写 
字母 、 小 写字 母 、 数 字 和 特殊 符号 组 成 ， 如 代码 清单 7-5 所 示 ， 


代码 清单 7-5 生成 随机 密码 : 简单 8 位 





private static final String SPECIAL_CHARS = "1@#$%A&*_ =+-/"; 
private static char nextChar(Random rnd){ 
switch(rnd.nextInt(4)){ 
case 0: 
return (char)('a'+rnd.nextInt(26)); 
case 1: 
return (char)('A'+rnd.nextInt(26)); 
case 2: 
return (char)('O'+rnd.nextInt(10)); 
default: 
return SPECIAL_CHARS ,charAt(rnd,nextInt(SPECIAL_CHARS ,Jength() ) ) ; 
} 


public static String randomPassword(){ 
char[] chars = new char[8]; 
Random rnd = new Random(); 
for(int i=0; i<8; i++){ 
chars[i] = nextchar(rnd); 


return new String(chars); 


a 


这 段 代 码 ， 对 每 个 字符 ， 先 随机 选 关 型 ， 然 后 在 给 定 类 型 中 随机 选 
字符 。 在 笔者 的 计算 机 中 ， 一 次 的 随机 运行 结果 是 : 





8Ctp2S4H 








这 个 结果 不 含 特殊 字符 。 很 多 环境 对 密码 复杂 度 有 要 求 ， 比 如 ， 至 
少 要 含 一 个 大 写字 母 、 一 个 小 写字 母 、 一 个 特殊 符号 、 一 个 数字 。 以 上 
的 代码 满足 不 了 这 个 要 求 ， 怎 么 满足 昵 ? 一 种 可 能 的 代码 如 代码 清单 7- 
6 所 示 。 


代码 清单 7-6 生成 随机 密码 : 复杂 8 位 








private static int nextIndex(char[] chars，Random rnd){ 
int index = rnd.nextInt(chars.1length); 
while(chars[index]!=0){ 
index = rnd.nextInt(chars.1length); 


return index; 


private static char nextSpecialCchar(Random rnd){ 
return SPECIAL_CHARS.charAt(rnd.nextInt(SPECIAL_CHARS.1length())); 
} 


private static char nextUpperlLetter(Random rnd){ 
return (char)('A'+rnd.nextInt(26)); 


private static char nextLowerLetter(Random rnd){ 
return (char)('a'+rnd.nextInt(26)); 


private static char nextNumLetter(Random rnd){ 
return (char)('0'+rnd.nextInt(10)); 


public static String randomPassword(){ 
char[] chars = new char[8]; 
Random rnd = new Random(); 
chars[nextIndex(chars, rnd)] 
chars[nextIndex(chars, rnd)] 
chars[nextIndex(chars, rnd)] 
chars[nextIndex(chars, rnd)] 
for(int i=0; i<8; i++){ 

if(chars[i]==0){ 
chars[I] = nextchar(rnd); 


nextSpecialChar(rnd); 
nextUpperlLetter(rnd); 
nextLowerLetter(rnd); 
nextNumLetter(rnd); 


return new String(chars); 





nextImdex 随 机 生成 一 个 未 赋值 的 位 置 ， 程 序 先 随机 生成 4 个 不 同类 
型 的 字符 ， 放 到 随机 位 置 上 ， 然 后 给 未 赋值 的 其 他 位 置 随机 生成 字符 。 


7.6.5 洗 牌 


一 种 常见 的 随机 场景 是 洗 牌 ， 就 是 将 一 个 数组 或 序列 随机 重新 排 
列 。 我 们 以 一 个 整数 数组 为 例 来 介绍 如 何 随机 重 排 ， 如 代码 清单 7-7 所 
人 钞 。 


代码 清单 7-7 随机 重 排 





private static void swap(int[] arr, int i, int j)t{ 
int tmp = arr[i]; 
arr[i] = arr[j]; 
arr[j] = tmp; 


public static void shuffle(int[] arr){ 
Random rnd = new Random(); 
for(int i=arr.length; i>1; i--) { 
swap(arr, i-1, rnd.nextInt(i)); 
} 


} 





shuffle 方 法 能 将 参数 数组 arr 随 机 重 排 ， 来 看 使 用 它 的 代码 : 





int[] arr = new int[13]; 
for(int i=0; i<arr.length; i++){ 
arr[i] = i; 


} 
shuffle(arr); 
System,.out.println(Arrays.toSstring(arr)); 





调用 shuffle 方 法 前 ，arr 是 排 好 序 的 ， 调 用 后 ， 一 次 调用 的 输出 为 : 





[3, 8, 11, 10, 7, 9, 4, 1, 6, 12, 5, 0, 2] 





己 经 随机 重新 排序 了 。shuffle 的 基本 思路 是 什么 呢 ? 从 后 往 前 ， 逐 
ee 
语 扎 : 





swap(arr, i-1, rnd.nextInt(i)); 





i-1 表 示 当 前 要 赋值 的 位 置 ，rnd.nextInt (i) 表示 从 剩 下 的 元 素 中 随 


机 挑选 。 
7.6.6” 带 权重 的 随机 选择 


实际 场景 中 ， 经 常 要 从 多 个 选项 中 随机 选择 一 个 ， 不 过 ， 不 同 选 项 
经 常 有 不 同 的 权重 。 比 如 ， 给 用 户 随机 奖励 ， 三 种 面额 : 1 元 、5 元 和 10 
元 ， 权 重 分 别 为 70、20 和 10。 这 个 怎么 实现 呢 ? 实现 的 基本 思路 是 ， 使 
用 概率 中 的 累计 概率 分 布 。 


以 上 面 的 例子 来 次， 计算 每 个 选项 的 累计 概率 值 ， 首 先 计 算 总 的 权 


重 ， 这 里 正好 是 100， 每 个 选项 的 概率 是 70%、209% 和 109%， 宗 计 概 率 则 
分 别 是 70%、90% 和 100%。 


1 元 Ss 10 元 


0.7 0.9 1 .0 


图 7-2 ”选项 的 累计 概率 值 


有 了 累计 概率 ， 则 随机 选择 的 过 程 是 : 使 用 nextDouble 〈() 生成 一 
个 0 一 1 的 随机 数 ， 然 后 使 用 二 分 查找 ， 看 其 落 入 哪个 区 间 ， 如 果 小 于 等 
于 70% 则 选择 第 一 个 选项 ，70% 和 90% 之 间 选 第 二 个 ，90% 以 上 选 第 三 
个 ， 如 图 7-2 所 示 。 


Re 我 们 使 用 一 个 类 Pair 表 示 选 项 和 权重 ， 如 代码 清单 
7-8 有 TT 不 。 


代码 清单 7-8 ”表示 选项 和 权重 的 类 Pair 





class Pair { 
Object item; 
int weight; 
public Pair(Object item, int weight){ 
this.item = item; 
this.weight = weight; 


} 
public Object getItem() { 
return item; 


public int getweight() { 
return weight; 





四 我 们 使 用 一 个 闫 WeightRandom 表 示 融 权重 的 选择 ， 如 代码 清单 7-9 
修 。 


代码 清单 7-9 而 权重 的 选择 weightRandom 





public class WeightRandom { 

private Pair[] options; 

private double[] cumulativeProbabilities,; 

private Random rnd ; 

public WeightRandom(Pair[] options)t{ 
this.options = options; 
this,rnd = new Random( ) ; 
prepare() 


private void prepare(){ 
int weights = 0; 
for(Pair pair : options)t{ 
weights += pair.getweight(); 


cumulativeProbabilities = new double[options.1length]; 
int Sum = 0; 
for(int i = 0; i<options.length; i++) { 
sum += options[i].getweight(); 
cumulativeProbabilities[i] = sum / (double)weights,; 


} 


} 
public Object nextItem(){ 
double randomValue = rnd.nextDouble(); 
int index = Arrays.binarySearch(cumulativeProbabilities, randomValue); 
if(index < 0) { 
index = -index-1; 
} 


return options[index].getItem( ); 





其 中 ，prepare〈) 方法 计算 每 个 选项 的 累计 概率 ， 保 存在 数组 
cumulativeProbabilities 中 ，nextItem () 方法 根据 权重 随机 选择 一 个 ， 具 
体 束 是 ， 首 先生 成 一 个 0 一 1 的 数 ， 然 后 使 用 二 分 查找 ， 如 果 没 找到 ， 返 
回 结果 是 -〈 插 入 点 ) -1， 所 以 -index-1 就 是 插入 点 ， 插 入 点 的 位 置 就 对 
应 选项 的 索 3 


回 到 上 和 面 的 例子 ， 随 机 选择 10 次 ， 代 码 为 : 








O 








Pair[] options = new Pair[]t{ 
new Pair("1 元 ",7)，new Pair("2 元 "，2)，new Pair("10 元 "，14) 


/ 
weightRandom rnd = new WeightRandom(options ) ; 
for(int i=0; i<10; i++){ 
System.out.print(rnd.nextItem()+" "),; 





在 一 次 运行 中 ， 输 出 正好 符合 预期 ， 具 体 为 : 








1 元 1 元 1 元 2 元 1 元 10 元 1 元 2 元 1 元 1 元 





不 过 ， 和 需要 说 明 的 是 ， 由 于 随机 ， 每 次 执行 结果 比例 不 一 定 正好 相 


7.6.7” 抢 红包 算法 


我 们 都 知道 ， 微 信 可 以 抢 红 包 ， 红 包 有 一 个 总 金额 和 总 数量 ， 领 的 
时 候 随机 分 配 金额 。 金 额 是 怎么 随机 分 配 的 呢 ? 微 信 有 具体 是 怎么 做 的 ， 
我 们 并 不 能 确切 地 知道 ， 但 如 下 思路 可 以 达到 该 效果 。 


维护 一 个 剩余 总 金额 和 总 数量 ， 分 配 时 ， 如 果 数 量 等 于 1， 直 接 返 
回忆 金额 ， 如 果 大 于 1， 则 计算 平均 值 ， 并 设 定 随机 最 大 值 为 平均 值 的 
两 倍 ， 然 后 取 一 个 随机 值 ， 如 果 随 机 值 小 于 0.01， 则 为 0.01， 这 个 随机 
值 就 是 下 一 个 的 红包 金额 。 


我 们 来 看 代码 ， 如 代码 清单 7-10 所 示 ， 为 计算 方便 ， 金 额 用 整数 表 
示 ， 以 分 为 单位 。 


代码 清单 7-10” 抢 红包 算法 














public class RandomRedPacket { 

private int leftMoney; 

private int leftNum; 

private Random rnd ; 

public RandomRedPacket(int total, int num){ 
this.leftMoney = total; 
this.leftNum = num; 
this,rnd = new Random( ) ; 


public synchronized int nextMoney(){ 
if(this.1leftNum<=0){ 


throw new IllegalSstateException(" 抢 光 了 "); 


} 
if(this.leftNum==1){ 
return this.leftMoney; 


} 

double max = this.leftMoney/this.1leftNum*2d; 
int money = (int)(rnd.nextDouble( )*max); 
money = Math.max(1, money); 

this.leftMoney -= money; 

this.leftNum --， 

return money; 





代码 比较 简单 ， 束 不 解释 了 。 关 于 synchronized 修 饰 符 ， 此 处 可 以 
忽略 ， 留 待 第 15 章 介绍 。 看 一 个 使 用 的 例子 ， 总 金额 为 10 元 ，10 个 红 
包 ， 代 码 如 下 : 





RandomRedPacket redPacket = new RandomRedPacket(1000, 10); 
for(int i=0; i<10; i++){ 
System.out.print(redPpacket.nextMoney()+" "); 





一 次 输出 为 : 





136 48 90 151 36 178 92 18 122 129 





如 果 是 这 个 算法 ， 那 先 抢 好 ， 还 是 后 抢 好 呢 ? 先 抢 肯定 抢 不 到 特别 
大 的 ， 不 过 ， 后 抢 也 不 一 定 会 ， 这 要 看 前 面 抢 的 金额 ， 剩 下 的 多 就 有 可 
能 抢 到 大 的 ， 剩 下 的 少 融 不 可 能 有 大 的 。 





7.6.8 ”北京 购车 摇号 算法 

我 们 来 看 下 影响 很 多 人 的 北京 购车 摇号 ， 它 的 算法 是 怎样 的 呢 ? 思 
路 大 概 是 这 样 的 : 

1) 每 期 摇号 前 ， 将 每 个 符合 摇号 资格 的 人 ， 分 配 一 个 从 0 到 总 数 的 
编号 ， 这 个 编号 是 公开 的 ， 比 如 总 人 数 为 2304567， 则 编号 为 0 一 
2304566。 


2) 播 号 第 一 步 是 生成 一 个 随机 种 子 数 ， 这 个 随机 种 子 数 在 播 号 当 





天 通过 一 定 流程 生成 ， 整 个 过 程 由 公证 员 公 证 ， 就 是 生成 一 个 真正 的 随 
机 数 。 


3) 种 子 数 生 成 后 ， 然 后 就 是 循环 调用 类 似 Random.nextInt (int n) 
方法 ， 生 成 中 签 的 编号 。 


编号 是 事先 确定 的 ， 种 子 数 是 当场 公证 随机 生成 的 ， 是 公开 的 ， 随 
算法 是 公开 直 明 的 ， 任 何 入 都 可 以 根据 公开 的 种 了 数 和 编号 验证 中 和 
编号。 


769 外 结 


本 节 介 绍 了 随机 ， 介 绍 了 Java 中 对 随机 的 支持 Math.random() 以 及 
Random 类 ， 介 绍 了 其 使 用 和 实现 原理 ， 同 时 ， 介 绍 了 随机 的 一 些 应 用 
场景 ， 包 括 随 机 密码 、 洗 牌 、 带 权重 的 随机 选择 、 微 信 抢 红包 和 北京 购 
车 摇号 ， 完 整 的 代码 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.commoncls.c34 下 。 


需要 说 明 的 是 ，Random 类 是 线程 安全 的 ， 也 就 是 说 ， 多 个 线程 可 
以 同时 使 用 一 个 Random 实 例 对 象 ， 不 过 ， 如 果 并 发 性 很 高 ， 会 产生 竞 
争 ， 这 时 ， 可 以 考虑 使 用 多 线程 库 中 的 ThreadLocalRandom 类 。 另 外 ， 
Java 类 库 中 还 有 一 个 随机 类 SecureRandom， 可 以 产生 安全 性 更 高 、 随 机 
性 更 强 的 随机 数 ， 用 于 安全 加 密 等 领域 。 


至 此 ， 关 于 常用 基础 类 就 介绍 完了 。 我 们 深入 分 析 了 各 种 包装 类 、 
String、String-Builder、Arrays、 日 期 和 时 间 、 以 及 随机 ， 这 些 都 是 日 党 
程序 中 经 常用 到 的 功能 。 还 有 一 些 基础 类 ， 限 于 篇 幅 ， 就 不 介绍 了 ， 比 
如 UUID、Math 和 Objects，UUID 用 于 随机 生成 需要 确保 唯一 性 的 标识 
符 ，Math 用 于 进行 数学 运算 ，Objects 包 含 一 些 操作 对 象 、 检 查 条 件 的 方 
法 ， 具 体 可 参看 API 文 档 。 


之 前 章节 中 ， 我 们 经 常 提 到 泛 型 这 一 概念 ， 它 到 底 是 什么 呢 ? 让 我 
们 下 一 章 详细 探讨 。 





二 人 型 与 窒 宙 
第 8 章 ” 泛 型 
第 9 章 ”列表 和 队列 
:第 10 章 ”Map 和 Set 
第 11 章 ” 堆 与 优先 级 队列 


:第 12 间 ”通用 容器 类 和 忆 结 


第 8 章 ” 泛 型 


之 前 章节 中 我 们 多 次 提 到 过 泛 型 这 个 概念 ， 本 章 我 们 就 来 详细 讨论 
Java 中 的 泛 型 。 虽 然 泛 型 的 基本 思维 和 概念 是 比较 简单 的 ， 但 它 有 一 些 
非常 令 人 费解 的 语法 、 细 节 ， 以 及 局 限 性 。 


后 续 章 节 我 们 会 介绍 各 种 容器 类 。 容 器 类 可 以 说 是 日 常 程序 开发 中 
天 天 用 到 的 ， 没 有 容器 类 ， 难 以 想象 能 开发 什么 真正 有 用 的 程序 。 而 容 
髓 类 是 基于 泛 型 的 ， 不 理解 泛 型 ， 就 难以 深刻 理解 容器 类 。 那 沁 型 到 底 
古 什么 呢 ? 本 章 我 们 分 为 三 节 逐 步 来 讨论 : 8.1 节 主要 介绍 泛 型 的 基本 
概念 和 原理 ，8.2 市 重点 介绍 令 人 费解 的 通配符 ，8.3 市 介绍 一 些 细节 和 
泛 型 的 局 限 性 。 








8.1 基本 概念 和 原理 


之 前 我 们 一 直 强 调 数据 类 型 的 概念 ，Java 有 8 种 基本 类 型 ， 可 以 定 
义 类 ， 类 相当 于 目 定 义 数据 类 型 ， 类 之 间 还 可 以 有 组 合 和 继承 。 我 们 也 
介绍 了 接口 ， 其 中 提 到 ， 很 多 时 候 我 们 关心 的 不 是 类 型 ， 而 是 能 力 ， 针 
We 














泛 型 将 接口 的 概念 进一步 延伸 ，“ 泛 型 > 的 字面 意思 惑 是 广泛 的 类 
型 。 类 、 接 口 和 方法 代码 可 以 应 用 于 非常 广泛 的 类 型 ， 代 码 与 它们 能 够 
操作 的 数据 类 型 不 再 绑 定 在 一 起 ， 同 一 套 代 码 可 以 用 于 多 种 数据 类 型 ， 
0 


这 么 说 可 能 比较 抽象 ， 接 下 来 ， 我 们 通过 一 些 例子 逐步 进行 说 明 。 
在 Java 中 ， 类 、 接 口 、 方 法 都 可 以 是 泛 型 的 ， 我 们 先 来 看 泛 型 类 。 


8.1.1 一 个 简单 泛 型 类 


我 们 通过 一 个 简单 的 例子 来 说 明 泛 型 类 的 基本 概念 、 基 本 原理 和 泛 
型 的 好 处 。 


1. 基 本 概念 
我 们 直接 来 看 代码 : 


public class Pair<T> { 
T first 
T second; 
public Pair(T first, T second)t{ 
this.first = first,; 
this.second = second; 


} 
public T getFirst() { 
return first， 


} 
public T getSecond() { 
return second; 





Pair 就 是 一 个 泛 型 类 ， 与 普通 类 的 区 别 体 现在 : 
1) 类 名 后 面 多 了 一 个 <T>; 
2) first 和 和 second 的 类 型 都 是 T。 


TI 是 什么 呢 ? TI 表 示 类 型 参数 ， 泛 型 就 是 类 型 参数 化 ， 处 理 的 数据 
类 型 不 是 固定 的 ， 而 是 可 以 作为 参数 传 入 。 怎么 用 这 个 泛 型 类 ， 并 传 
递 类 型 参数 呢 ? 看 代码 : 





Pair<Integer> minmax = new Pair<Integer>(1,100); 
Integer min = minmax.getrFirst(); 
Integer max = minmax.getSecond(); 





Pair<Integer> 中 的 Integer 就 是 传递 的 实际 类 型 参数 。Pair 类 的 代码 和 
它 处 理 的 数据 类 型 不 是 绑 定 的 ， 有 具体 类 型 可 以 变化 。 上 面 是 Integer， 也 
可 以 是 String， 比 如 : 





Pair<String> kv = new Pair<String>("name", " 老 马 "); 





类 型 参数 可 以 有 多 个 ，Pair 类 中 的 first 和 second 可 以 是 不 同 的 类 型 ， 
多 个 类 型 之 间 以 逗号 分 隅 ， 来 看 改进 后 的 Pair 类 定义 : 











public class Pair<U, V> { 
U first; 
V second; 
public Pair(U first, V second){ 
this.first = first,; 
this.second = second; 


} 
public U getFirst() { 
return first,; 


} 
public V getSecond() { 
return second; 





可 以 这 样 使 用 : 





Pair<String,Integer> pair = new Pair<String,Integer>(" 老 马 ",100); 








<String，Integer> 既 出 现在 了 声明 变量 时 ， 也 出 现在 了 new 后 面 ， 比 
较 烦 琐 ， 从 Java 7 开始 ， 文 持 省 略 后 面 的 类 型 参数 ， 可 以 如 下 使 用 : 





Pair<String,Integer> pair = new Pair<>(" 老 妃 ",100) ; 





2. 基 本 原理 


泛 型 类 型 参数 到 底 是 什么 呢 ? 为 什么 一 定 要 定义 类 型 参数 昵 ? 定义 
普通 类 ， 直 接 使 用 Object 不 就 行 了 吗 ? 比 如 ，Pair 类 可 以 写 为 : 





public class Pair { 
Object first,; 
Object second; 
public Pair(Object first, Object second){ 
this.first = first,; 
this.second = second; 


} 
public Object getFirst() { 
return first， 


} 
public Object getSecond() { 
return second; 





使 用 Pair 的 代码 可 以 为 : 





Pair minmax = new Pair(1,100); 

Integer min = (Integer)minmax.getFirst(); 
Integer max = (Integer)minmax.getSecond(); 
Pair kv = new Pair("name", " 老 马 "); 

String key = (String)kv.getFirst(); 

String value = (String)kv.getSecond(); 





这 样 是 可 以 的 。 实 际 上 ，Java 泛 型 的 内 部 原理 就 是 这 样 的 。 


我 们 知道 ，Java 有 Java 编 译 器 和 Java 虚 拟 机 ， 编 译 器 将 Java 源 代码 转 
换 为 .class 文 件 ， 虚 拟 机 加 载 并 运行 .class 文 件 。 对 于 泛 型 类 ，Java 编 译 器 
会 将 泛 型 代码 转换 为 普通 的 非 泛 型 代码 ， 就 像 上 面 的 普通 Pair 类 代码 及 
其 使 用 代码 一 样 ， 将 类 型 参数 T 擦 除 ， 蔡 换 为 Object， 插 入 必要 的 强制 


类 型 转换 。Java 虚 拟 机 实际 执行 的 时 候 ， 它 是 不 知道 泛 型 这 回 事 的 ， 只 
知道 普通 的 类 及 代码 。 


再 强调 一 下 ，Java 泛 型 是 通过 探 除 实现 的 ， 类 定义 中 的 类 型 参数 如 
会 被 蔡 换 为 Object， 在 程序 运行 过 程 中 ， 不 知道 泛 型 的 实际 类 型 参 
数 ， 比 如 Pair<Integer>， 运 行 中 只 知道 Pair， 而 不 知道 Integer。 认 识 到 这 

一 点 是 非常 重要 的 ， 它 有 助 于 我 们 理解 Java 泛 型 的 很 多 限制 。 


Java 为 什么 要 这 么 设计 有 昵 ? 泛 型 是 Java 5 以 后 才 支 持 的 ， 这 么 设计 
是 为 了 兼容 性 而 不 得 已 的 一 个 选择 。 


3. 泛 型 的 好 处 

既然 只 使 用 普通 类 和 Object 束 可 以 ， 而 且 泛 型 最 后 也 转换 为 了 普 
类 ， 那 为 什么 还 要 用 泛 型 呢 ? 或 者 说 ， 泛 型 到 底 有 什么 好 处 昵 ? 泛 型 
要 有 两 个 好 处 : 

:更 好 的 安全 性 。 

:更 好 的 可 读 性 。 

语言 和 程序 设计 的 一 个 重要 目标 是 将 bug 尽 量 消灭 在 摇篮 里 ， 能 消 
灭 在 写 代 码 的 时 候 ， 就 不 要 等 到 代码 写 完 程序 运行 的 时 候 。 只 使 用 


Object， 代 码 写 错 的 时 候 ， 开发 环境 和 编译 器 不 能 帮 我 们 发 现 问题 ， 看 
代码 : 














Pair pair = new Pair(" 老 马 ",1); 
Integer id = (Integer)pair.getFirst(); 
String name = (String)pair.getSecond(); 








看 出 问题 了 吗 ? 写 代 码 时 不 小 心 把 类 型 弄 错 了 ， 不 过 ， 代 码 编译 时 
是 没有 任何 问题 的 ， 但 运行 时 程序 抛 出 了 类 型 转换 异常 
ClassCastException。 如 果 使 用 泛 型 ， 则 不 可 能 犯 这 这 个 错 错误 ， 比 如 下 面 的 
代码 : 








Pair<String,Integer> pair = new Pair<>(" 老 马 ",1); 
Integer id = pair.getFirst(); // 有 编译 错误 
String name = pair.getSecond(); // 有 编译 错误 




















开发 环境 〈 如 Eclipse) 会 提示 类 型 错误 ， 即 使 没有 好 的 开发 环境 ， 
编译 时 Java 编 译 器 也 会 提示 。 这 称 之 为 类 型 安全 ， 也 就 是 说 ， 通 过 使 用 
泛 型 ， 开 发 环境 和 编译 器 能 确保 不 会 用 错 类 型 ， 为 程序 多 设置 一 道 安 全 
防护 网 。 使 用 泛 型 ， 还 可 以 省 去 烦琐 的 强制 类 型 转换 ， 再 加 上 明确 的 类 
型 信息 ， 代 码 可 读 性 也 会 更 好 。 





8.1.2 黎 吉 类 





泛 型 类 最 种 见 的 用 途 是 作为 容 圳 类。 所 谓 容 需 类 ， 简 单 地 说 ， 就 是 
容纳 并 管理 多 项 数据 的 类 。 数 组 束 是 用 来 管理 多 项 数据 的 ， 但 数组 有 很 
多 限制 ， 比 如 ,长度 固定 ， 插 入 、 删 除 操作 效率 比较 低 。 计 算 机 技术 有 
一 门 读 程 叫 数据 结构 ， 专 门 讨论 管理 数据 的 各 种 方式 。 


这 些 数据 结构 在 Java 中 的 实现 主要 就 是 Java 中 的 各 种 容器 类 ， 其 至 
Java 泛 型 的 引入 主要 也 是 为 了 更 好 地 文 持 Java 容 器 。 后 续 章 蔬 我 们 会 详 
细 讨 论 主要 的 Java 容 器 ， 本 节 先 实现 一 个 非常 简单 的 Java 容 髓 ， 来 解释 
泛 型 的 一 些 概念 。 


我 们 来 实现 一 个 简单 的 动态 数组 容 句 。 所 谓 动 态 数组 ， 就 是 长 度 可 
变 的 数组 。 底 层 数 组 的 长 度 当然 是 不 可 变 的 ， 但 我 们 提供 一 个 类 ， 对 这 
个 类 的 使 用 者 而 言 ， 好 像 就 是 一 个 长 度 可 变 的 数组 。Java 容 需 中 有 一 个 
对 应 的 类 ArrayList， 本 市 我 们 来 实现 一 个 简化 版 ， 如 代码 清单 8-1 所 
外。 











代码 清单 8-1 动态 数组 DynamicArray 





public class DynamicArray<E> { 
private static final int DEFAULT_CAPACITY = 10; 
private int size,; 
private Object[] elementData; 
public DynamicArray() { 
this.elementData = new Object[DEFAULT_CAPACITY!]; 
} 


private void ensureCapacity(int minCapacity) { 
int oldCapacity = elementData.1length; 
if(oldCapacity >= minCapacity)t{ 
return; 


int newCapacity = oldCapacity * 2,; 
if(newCapacity < minCapacity) 
newCapacity = minCapacity; 
elementData = Arrays.copyof (elementData, newCapacity); 


public void add(E e) { 
ensureCapacity(size + 1); 
elementData[size++] = e; 


} 
public E get(int index) { 
return (E)elementData[index]; 


public int size() { 
return size; 


public E set(int index, E element) { 
E oldValue = get(index); 
elementData[index] = element; 
return oldvValue; 





DynamicArray 束 是 一 个 动态 数组 ， 内 部 代码 与 我 们 之 前 分 析 过 的 
StringBuilder 类 似 ， 通 过 ensureCapacity 方 法 来 根据 需要 扩展 数组 。 作 为 
一 个 容 右 类 ， 它 容纳 的 数据 类 型 是 作为 参数 传递 过 来 的 ， 比 如 ， 存 放 
Double 类 型 ， : 








DynamicArray<Double> arr = new DynamicArray<Double>(); 
Random rnd = new Random(); 
int size = 1i+rnd.nextInt(100); 
for(int i=0; i<size; i++){ 
arr.add(Math.random( )); 


} 
Double d = arr.get(rnd.nextInt(size)); 





这 就 是 一 个 简单 的 容器 类 ， 适 用 于 各 种 数据 类 型 ， 日 类 型 安全 。 后 
文 还 会 以 Dynamic-Array 为 例 进 行 扩展 ， 以 解释 泛 型 概念 。 


具体 的 类 型 还 可 以 是 一 个 泛 型 类 ， 比 如 ， 可 以 这 样 写 : 








DynamicArray<Pair<Integer,String>> arr = new DynamicArray<>() 





ar 表示 一 个 动态 数组 ， 每 个 元 素 是 Pair<Integer，String> 类 型 。 
3 这 于 让 让 


除了 泛 型 类 ， 方 法 也 可 以 是 泛 型 的 ， 而 且 ， 一 个 方法 是 不 是 泛 型 
的 ， 与 它 所 在 的 类 是 不 是 泛 型 没有 什么 关系 。 我 们 看 个 例子 : 


cc 
public static <T> int indexof(T[] arr，T elm){ 
for(int i=0; i<arr.length; i++){ 
if(arr[i].equals(elm)){ 
return 工 ; 


return -1; 








这 个 方法 就 是 一 个 泛 型 方法 ， 类 型 参数 为 T， 放 在 返回 值 前 面 ， 它 
可 以 如 下 调用 : 





Indexof(new Integer[]{1,3,5}, 10) 





也 可 以 如 下 调用 : 





indexof(new String[]{"hello", " 老 马 ", "编程 "}，" 老 马 ") 





indexOf 表 示 一 个 算法 ， 在 给 定数 组 中 寻找 系 个 元 系 ， 这 个 算法 的 
基本 过 程 与 具体 数据 类 型 没有 什么 关系 ， 通 过 泛 型 ， 它 可 以 方便 地 应 用 
于 各 种 数据 类 型 ， 且 由 编译 器 保证 类 型 安全 。 


与 泛 型 类 一 样 ， 类 型 参数 可 以 有 多 个 ， 以 喜 号 分隔 ， 比 如 : 








public static <U,V> Pair<U,V> makePair(U first, V Second ){ 
Pair<U,V> pair = new Pair<>(first, second); 
return pair,; 


} 





与 泛 型 类 不 同 ， 调 用 方法 时 一 般 并 不 需要 特意 指定 类 型 参数 的 实际 
类 型 ， 比 如 调用 make-Pair: 





makePair(1," 老 马 "); 





并 不 需要 告诉 编译 器 U 的 类 型 是 Integer，V 的 类 型 是 String，Java 编 
译 右 可 以 自动 推 师 出 来 。 


8.1.4 泛 型 接口 





接口 也 可 以 是 泛 型 的 ， 我 们 之 前 介绍 过 的 Comparable 和 Comparator 
接口 都 是 泛 型 的 ， 它 们 的 代码 如 下 : 





public interface Comparable<T> { 
public int compareTo(T 0); 


public interface Comparator<T> { 
int compare(T o1, T 02); 
boolean equals(Object obj); 





与 前 面 一 样 ，T 是 类 型 参数 。 实 现 接 口 时 ， 应 该 指定 具体 的 类 型 ， 
比如 ， 对 Integer 类 ， 实 现代 码 是 : 





public final class Integer extends Number implements Comparable<Integer>{ 
public int compareTo(Integer anotherInteger) { 
return compare(this.value, anotherIinteger .value); 


} 
// 其 他 代码 





通过 implements Comparable<Integer>，Integer 实 现 了 Comparable 接 
口 ， 指 定 了 实际 类 型 参数 为 Integer， 表 示 Integer 只 能 与 Integer 对 象 进 行 
比较 。 


再 看 Comparator 的 一 个 例子 ，String 类 内 部 一 个 Comparator 的 接口 实 
现 为 : 








private static class CaseInsensitiveComparator 
implements Comparator<String> { 
public int compare(String si, String s2) { 
// 省 略 主 体 代码 
} 











这 里 ， 指 定 了 实际 类 型 参数 为 String。 


8.1.5 ”类 型 参数 的 限定 


在 之 前 的 介绍 中 ， 无 论 是 泛 型 类 、 泛 型 方法 还 是 泛 型 接口 ， 关 于 类 
型 参数 ， 我 们 都 知之 其 少 ， 只 能 把 它 当 作 Object ”但 Java 支 持 限定 这 个 
参数 的 一 个 上 界 ， 也 束 是 说 ， 参 数 必 须 为 给 定 的 上 界 类 型 或 其 子 类 型 ， 
1 限定 是 通过 <xtends 关 键 字 来 表示 的 。 这 个 上 界 可 以 是 某 个 具体 的 类 
ee 也 可 以 是 其 他 的 类 型 参数 ， 我 们 逐个 介绍 其 应 


1. 上 界 为 某 个 具体 类 


比如 ， 上 面 的 Pair 类 ， 可 以 定义 一 个 子 类 NumberPair， 限 定 两 个 类 
型 参数 必须 为 Number， 代码 如 下 ; 








public class NumberPair<U extends Number, V extends Number> 
extends Pair<U, V> { 
public NumberPair(U first, V second) { 
super(first, second); 





限定 类 型 后 ， 就 可 以 使 用 该 类 型 的 方法 了 。 比 如 ， 对 于 NumberPair 
类 ，first 和 second 变 量 就 可 以 当 作 Number 进 行 处 理 了 。 比 如 可 以 定义 一 
个 求 和 方法 ， 如 下 所 示 : 





public double sum(){ 
return getFirst().doubleVvalue() +getSecond().doubleVvalue(); 





可 以 这 么 用 : 





NumberPair<Integer, Double> pair = new NumberPair<>(10, 12.34); 
double sum = pair.sum(); 





限定 类 型 后 ， 如 果 类 型 使 用 错误 ， 编 译 器 会 提示 。 指 定 边界 后 ， 类 
型 擦 除 时 就 不 会 转换 为 Object 了， 而 是 会 转换 为 它 的 边界 类 型 ， 这 也 是 
容易 理解 的 。 


2. 上 界 为 某 个 接口 
在 泛 型 方法 中 ， 一 种 常见 的 场景 是 限定 类 型 必须 实现 Comparable 接 





口 ， 我 们 来 看 代码 : 





public static <T extends Comparable> T max(T[] arr){ 
T max = arr[90]; 
for(int i=1; i<arr.length; i++){ 
if(arr[i].compareTo(max)>0){ 
max = arr[il]; 


} 


return max; 


} 








max 方 法 计算 一 个 泛 型 数组 中 的 最 大 值 。 计 算 最 大 值 需要 进行 元 素 
之 间 的 比较 ， 要 求 元 素 实现 Comparable 接 口 ， 所 以 给 类 型 参数 设置 了 一 
个 上 边界 Comparable，TI 必 须 实现 Comparable 接 口 。 


不 过 ， 直 接 这 么 编写 代码 ，Java 中 会 给 一 个 警告 信息 ， 因 为 
Comparable 是 一 个 泛 型 接口 ， 它 也 需要 一 个 类 型 参数 ， 所 以 完整 的 方法 
声明 应 该 是 : 











public static <T extends Comparable<T>> T max(T[] arr)t{ 


// 主 体 代码 





<T extends Comparable<T>> 是 一 种 令 人 费解 的 语法 形式 ， 这 种 形式 
称 为 递归 类 型 限制 ， 可 以 这 么 解读 : T 表 示 一 种 数据 类 型 ， 必 须 实现 
Comparable 接 口 ， 且 必须 可 以 与 相同 类 型 的 元 素 进 行 比较 。 


3. 上 界 为 其 他 类 型 参数 


上 面 的 限定 都 是 指定 了 一 个 明确 的 类 或 接口 ，Java 文 持 一 个 类 型 参 
数 以 另 一 个 类 型 参数 作为 上 界 。 为 什么 需要 这 个 呢 ? 我 们 看 个 例子 ， 给 
上 面 的 DynamicArray 类 增加 一 个 实例 方法 addAll， 这 个 方法 将 参数 容器 
中 的 所 有 元 素 都 添加 到 当前 容器 里 来 ， 直 觉 上 ， 代 码 可 以 如 下 书写 : 

















public void addAll(DynamicArray<E> c) { 
for(int i=0; i<c.size; I++){ 
add(c.get(i)); 





但 这 么 写 有 一 些 局 限 性 ， 我 们 看 使 用 它 的 代码 : 





DynamicArray<Number> numbers = new DynamicArray<>( ) ; 
DynamicArray<Integer> ints = new DynamicArray<>() ; 
ints,add(100) ; 

ints.add(34); 

numbers.addAll(ints); // 会 提示 编译 错误 








numbers 是 一 个 Number 类 型 的 容器 ，ints 是 一 个 Integer 类 型 的 容器 ， 
我 们 希望 将 ints 添 加 到 numbers 中 ， 因 为 Integer 是 Number 的 子 类 ， 应 该 
说 ， 这 是 一 个 合理 的 需求 和 操作 。 


但 Java 会 在 numbers.addAll (ints) 这 行 代码 上 提示 编译 错误 : 
addAl 需 要 的 参数 类 型 为 DynamicArray<Number>， 而 传递 过 来 的 参数 类 
型 为 DynamicArray<Integer>， 不 适用 。Integer 是 Number 的 子 类 ， 怎 么 会 
不 适用 呢 ? 


事实 就 是 这 样 ， 确 实 不 适用 ， 而 且 是 很 有 道理 的 ， 假 设 适用 ， 我 们 
看 下 会 发 生 什 么 。 





DynamicArray<Integer> ints = new DynamicArray<>() ， 
DynamicArray<Number> numbers = ints; // 假 设 这 行 是 合法 的 
numbers.add(new Double(12.34)); 








那 最 后 一 行 就 是 合法 的 ， 这 时 ，DynamicArray<Integer> 中 就 会 出 现 
Double 类 型 的 值 ， 而 这 显然 破坏 了 Java 汉 型 关于 类 型 安全 的 保证 。 


我 们 强调 一 下 ， 虽 然 Integer 是 Number 的 子 类 ， 但 
DynamicArray<Integer> 并 不 是 DynamicArray<Number> 的 子 类 ， 
DynamicArray<Integer> 的 对 象 也 不 能 赋值 给 Dynamic-Array<Number> 的 
， 这 一 点 初 看 上 去 是 违反 直觉 的 ， 但 这 是 事实 ， 必 须要 理解 这 一 

不 过 ， 我 们 的 需求 是 合理 的 ， 将 Integer 添 加 到 Number 容 器 中 并 没有 
问题 。 这 个 问题 可 以 通过 类 型 限定 来 解决 : 





public <T extends E> void addAll(DynamicArray<T> c) { 
for(int i=0; i<c.size; I++){ 
add(c.get(i)); 





E 是 DynamicArray 的 类 型 参数 ，T 是 addAl 的 类 型 参数 ，T 的 上 界限 
定 为 E， 这 样 ， 下 面 的 代码 就 没有 问题 了 : 








DynamicArray<Number> numbers = new DynamicArray<>(); 
DynamicArray<Integer> ints = new DynamicArray<>(); 
ints.add(100); 

ints.add(34); 

numbers.addAll(ints); 





对 于 这 个 例子 ， 这 种 写法 有 点 烦琐 ，8.2 节 中 我 们 会 介绍 一 种 简化 
的 方式 。 


8.16 ”小结 





泛 型 是 计算 机 程序 中 一 种 重要 的 思维 方式 ， 它 将 数据 结构 和 算法 与 
数据 类 型 相 分 离 ， 使 得 同一 套数 据 结构 和 算法 能 够 应 用 于 各 种 数据 类 
型 ， 而 且 可 以 保证 类 型 安全 ， 提 高 可 读 性 。 在 Java 中 ， 泛 型 广泛 应 用 于 
各 种 容 圳 类 中 ， 理 解 泛 型 是 深刻 理解 容器 的 基础 。 


本 节 介 绍 了 泛 型 的 基本 概念 ， 包 括 泛 型 类 、 泛 型 方法 和 泛 型 接口 ， 
关于 类 型 参数 ， 我 们 介绍 了 多 种 上 界限 定 ， 限 定 为 某 具 体 类 、 茶 具体 接 
口 或 其 他 类 型 参数 。 泛 型 类 最 常见 的 用 途 是 容器 类 ， 我 们 实现 了 一 个 简 
单 的 容器 类 DynamicArray， 以 解释 泛 型 概念 。 


在 Java 中 ， 泛 型 是 通过 类 型 探 除 来 实现 的 ， 它 是 Java 编 译 器 的 概 
念 ，Java 虚 拟 机 运行 时 对 泛 型 基本 一 无 所 知 ， 理 解 这 一 点 是 很 重要 的 ， 
它 有 助 于 我 们 理解 Java 泛 型 的 很 多 局 限 性 。 


关于 泛 型 ，Java 中 有 一 个 通配符 的 概念 ， 用 得 很 广泛 ， 但 语法 非常 
令 人 宽 解 ， 而 且 容 易 混 消 ，8.2 节 中 ， 我 们 力图 对 它 进 行 清晰 的 齐 析 。 











8.2 ”解析 通配符 


本 布 主 要 讨论 泛 型 中 的 通配符 概念 。 通 配 符 有 着 令 人 费解 和 混 消 的 
语法 ， 但 通配符 大 量 应 用 于 Java 容 絮 类 中 ， 它 到 底 是 什么 ”下面 我 们 逐 
步 来 解析 。 





8.2.1 更 简洁 的 参数 类 型 限定 


在 8.1 节 最 后 ， 我 们 提 到 一 个 例子 ， 为 了 将 Integer 对 象 添加 到 
Number 容 器 中 ， 我 们 的 类 型 参数 使 用 了 其 他 类 型 参数 作为 上 界 ， 我 们 
提 到 ， 这 种 写法 有 点 烦琐 ， 它 可 以 替换 为 更 为 简洁 的 通配符 形式 : 





public void addAll(DynamicArray<? extends E> c) { 
for(int i=0; i<c.size; I++){ 
add(c.get(i)); 
} 
} 








这 个 方法 没有 定义 类 型 参数 ，c 的 类 型 是 DynamicArray<? extends 
E>，? 表示 通配符 ，<? extends E> 表示 有 限定 通配符 ， 匹配 E 或 E 的 某 
个 子 类 型 ， 具 体 什么 子 类 型 是 未 知 的 。 使 用 这 个 方法 的 代码 不 需要 做 任 
何 改 动 ， 还 可 以 是 : 











DynamicArray<Number> numbers = new DynamicArray<>( ) ， 
DynamicArray<Integer> ints = new DynamicArray<>( ) ， 
ints,add(100) ; 

ints,add(34) ; 

numbers.addAll(ints); 





这 里 ，E 是 Number 类 型 ，DynamicArray<? extends E> 可 以 匹配 
DynamicArray<Integer>。 


那么 问题 来 了 ， 同 样 是 extends 关 键 字 ， 同 样 应 用 于 泛 型 ，<T 
extends E> 和 <? extends E> 到 底 有 什么 关系 ? 它们 用 的 地 方 不 一 样 ， 我 
们 解释 一 下 : 


1) <T extends E> 用 于 定义 类 型 参数 ， 它 声明 了 一 个 类 型 参数 T， 
可 放 在 泛 型 类 定义 中 类 名 后 面 、 泛 型 方法 返回 值 前 面 。 


2) <? extends E> 用 于 实例 化 类 型 参数 ， 它 用 于 实例 化 泛 型 变量 中 
的 类 型 参数 ， 只 是 这 个 具体 类 型 是 未 知 的 ， 只 知道 它 是 EE 或 E 的 茶 个 子 
类 型 。 


里 然 它 们 不 一 样 ， 但 两 种 写法 经 第 可 以 达成 相同 目标 ， 比 如 ， 前 面 
例子 中 ， 下 面 两 种 写法 都 可 以 : 














public void addAll(DynamicArray<? extends E> c) 
public <T extends E> void addAll(DynamicArray<T> c) 





那么 ， 到 底 应 该 用 哪 种 形式 呢 ? 我 们 先进 一 步 理解 通配符 ， 然 后 再 
解释 。 


8.2.2 ”理解 通配符 





除了 有 限定 通配符 ， 还 有 一 种 通配符 ， 形 如 DynamicArray<? >， 称 
为 无 限定 通配符 。 我 们 来 看 个 例子 ， 在 DynamicArray 中 查找 指定 元 
素 ， 代 码 如 下 : 





public static int indexof(DynamicArray<?> arr, Object elm){ 
for(int i=0; i<arr.size(); i++){ 
if(arr.get(i).equals(elm)){ 
return 工 ; 


} 


return -1; 


} 





其 实 ， 这 种 无 限定 通配符 形式 也 可 以 改 为 使 用 类 型 参数 。 也 就 是 
说 ， 下 面 的 写法 : 





public static int indexof(DynamicArray<?> arr, Object elm) 





可 以 改 为 : 


public static <T> int indexof(DynamicArray<T> arr, Object elm) 





不 过 ， 通 配 符 形 式 更 为 简洁 。 虽 然 通配符 形式 更 为 简洁 ， 但 上 面 两 
a 只 能 读 ， 不 能 写 。 怎么 理解 呢 ? 看 下 
面 的 例子 : 





DynamicArray<Integer> ints = new DynamicArray<>(); 
DynamicArray<? extends Number> numbers = ints,; 
Integer a = 200; 

numbers.add(a); // 错 误 ! 

numbers.add( (Number)a); // 错 误 ! 
numbers.add((0bject)a); // 错 误 ! 





三 种 add 方 法 都 是 非法 的 ， 无 论 是 Integer， 还 是 Number 或 Object， 
编译 器 都 会 报错 。 为 什么 昵 ?问号 就 是 表示 类 型 安全 无 知 ，? extends 
Number 表 示 是 Number 的 某 个 子 类 型 ， 但 不 知道 具体 子 类 型 ， 如 果 人 允许 
写 入 ，Java 就 无 法 确保 类 型 安全 性 ， 所 以 干脆 禁止 。 我 们 来 看 个 例子 ， 
看 看 如 果 人 允许 写 入 会 发 生 什 么 : 











DynamicArray<Integer> ints = new DynamicArray<>(); 
DynamicArray<? extends Number> numbers = ints,; 
Number n = new Double(23.0); 

Object 0 = new String("hello world"); 
numbers.add(n); 

numbers.add(o); 











如 果 人 允许 写 入 Object 或 Number 类 型 ， 则 最 后 两 行 编译 就 是 正确 的 ， 
也 就 是 说 ，Java 将 允许 把 Double 或 String 对 象 放 入 Integer 容 器 ， 这 显然 违 
背 了 Java 关 于 类 型 安全 的 承诺 。 


大 部 分 情况 下 ， 这 种 限制 是 好 的 ， 但 这 使 得 一 些 理 应 正确 的 基本 操 
作 无 法 完成 ， 比 如 交换 两 个 元 素 的 位 置 ， 看 如 下 代码 : 





public static void swap(DynamicArray<?> arr, int i, int j)t{ 
Object tmp = arr.get(i); 
arr.set(i, arr.get(j)); 
arr.set(j, tmp); 














这 个 代码 看 上 去 应 该 是 正确 的 ， 但 Java 会 提示 编译 错误 ， 两 行 set 语 


句 都 是 非法 的 。 不 过 ， 借 助 带 类 型 参数 的 泛 型 方法 ， 这 个 问题 可 以 如 下 
解决 : 





private static <T> void swapInternal(DynamicArray<T> arr, int i, int j){ 
T tmp = arr.get(i); 
arr.set(i, arr.get(]j)); 
arr.set(j, tmp); 


public static void swap(DynamicArray<?> arr, int i, int j)t{ 
swapInternal(arr, i, j); 





swap 可 以 调用 swapInternal， 而 市 类 型 参数 的 swapInternal 可 以 写 
入 。Java 容 器 类 中 残 有 类 似 这 样 的 用 法 ， 公 共 的 API 是 通配符 形式 ， 形 
式 更 简单 ， 但 内 部 调用 带 类 型 参数 的 方法 。 


除了 这 种 需要 写 的 场合 ， 如 果 参 数 类 型 之 间 有 依赖 关系 ， 也 只 能 用 
类 型 参数 ， 比 如 ， 将 src 容 器 中 的 内 容 复制 到 dest 中 : 





public static <D,S extends D> void copy(DynamicArray<D> dest, 
DynamicArray<S> Src){ 
for(int i=0; i<src.size(); i++){ 
dest.add(src.get(i)); 





S 和 DD 有 依赖 关系， 要 么 相同 ， 要 么 S 是 D 的 子 类 ， 否 则 类 型 不 兼 
容 ， 有 编译 错误 。 不 过 ， 上 面 的 声明 可 以 使 用 通 丁 E 符 简化 ， 两 个 参数 可 
以 简化 为 一 个 ， 如 下 所 示 : 





public static <D> void copy(DynamicArray<D> dest, 
DynamicArray<? extends D> Src){ 
for(int i=0; i<src.size(); i++){ 
dest.add(src.get(i)); 
} 





如 果 返 回 值 依 赖 于 类 型 参数 ， 也 不 能 用 通配符 ， 比 如 ， 计 算 动态 数 
组 中 的 最 大 值 ， 如 下 所 示 : 





public static <T extends Comparable<T>> T max(DynamicArray<T> arr){ 
T max = arr.get(0); 


for(int i=1; i<arr.size(); i++){ 
if(arr.get(i).compareTo(max)>0){ 
max = arr.get(i); 


} 


return max; 





上 面 的 代码 就 难以 用 通配符 代 符 。 
现在 我 们 再 来 看 泛 型 方法 到 底 应 该 用 通配符 的 形式 还 是 加 类 型 参 
数 。 两 者 到 底 有 什么 关系 ?我 们 总 结 如 下 。 


1) 通配符 形式 都 可 以 用 类 型 参数 的 形式 来 普 代 ， 通 配 符 能 做 的 ， 
用 类 型 参数 都 能 做 。 


2) 通配符 形式 可 以 减少 类 型 参数 ， 形 式 上 往往 更 为 简单 ， 可 读 性 
也 更 好 ， 所 以 ， 能 用 通配符 的 束 用 通配符 。 

3) 如 果 类 型 参数 之 间 有 依赖 关系 ， 或 者 返回 值 依赖 类 型 参数 ， 或 
者 需要 写 操作 ， 则 只 能 用 类 型 参数 。 


4) 通配符 形式 和 类 型 参数 往往 配合 使 用 ， 比 如 ， 上 面 的 copy 方 
法 ， 定 义 必 要 的 类 型 参数 ， 使 用 通配符 表达 依赖 ， 并 接受 更 广泛 的 数据 


8.2.3” 超 类 型 通配符 


还 有 一 种 通配符 ， 与 形式 <? extends E> 正好 相反 ， 它 的 形式 为 <? 
super E>， 称 为 超 类 型 通配符 ， 表 示 E 的 某 个 父 类 型 。 它 有 什么 用 呢 ? 
有 了 它 ， 我 们 就 可 以 更 灵活 地 写 入 了 。 


如 果 没 有 这 种 语法 ， 写 入 会 有 一 些 限制 。 来 看 个 例子 ， 我 们 给 
DynamicArray 添 加 一 个 方法 : 





public void copyTo(DynamicArray<E> dest){ 
for(int i=0; i<size; i++){ 
dest.add(get(i)); 
} 


} 





这 个 方法 也 很 简单 ， 将 当前 容器 中 的 元 素 添 加 到 传 入 的 目标 容器 
中 。 我 们 可 能 希望 这 么 使 用 : 





DynamicArray<Integer> ints = new DynamicArray<Integer>(); 
ints.add(100); 

ints.add(34); 

DynamicArray<Number> numbers = new DynamicArray<Number>(); 
ints.copyTo(numbers); 





Integer 是 Number 的 子 类 ， 将 Integer 对 象 拷贝 入 Number 容 妖 ， 这 种 
用 法 应 该 是 合情合理 的 ， 但 Java 会 提示 编译 错误 ， 理 由 我 们 之 前 也 说 过 
了 ， 期 望 的 参数 类 型 是 Dynamic-Array<Integer>， 
DynamicArray<Number> 并 不 适用 。 


如 之 前 所 说 ， 一 般 而 言 ， 不 能 将 DynamicArray<Integer> 看 作 
DynamicArray<Number>， 但 门 这 里 的 用 法 是 没有 问题 的 ，Java 解 决 这 
个 问题 的 方法 就 是 超 类 型 通配符 ， 可 以 将 copyTo 人 代码 改 为 : 








public void copyTo(DynamicArray<? super E> dest){ 
for(int i=0; i<size; i++){ 
dest.add(get(i)); 
} 


} 








这 样 ， 就 没有 问题 了 。 


超 类 型 通配符 另 一 个 常用 的 场合 是 Comparable/Comparator 接 口 。 同 
样 ， 我 们 先 来 看 下 如 果 不 使 用 会 有 什么 限制 。 以 前 面 计算 最 大 值 的 方法 
为 例 ， 它 的 方法 声明 是 : 








public static <T extends Comparable<T>> T max(DynamicArray<T> arr) 





个 声明 有 什么 限制 呢 ? 举 个 简单 的 例子 ， 有 两 个 类 Base 和 Child， 
Base 的 代码 是 : 





Class Base implements Comparable<Base>{ 
private int Sortorder ; 
public Base(int sortOorder) { 
this,sortorder = Sortorder ， 


} 


Q@Override 
public int compareTo(Base 0) { 
if(sortorder < o.sortOoOrder){ 
return -1; 
}else if(sortorder > o.sortOrder)t{ 
return 1; 
}elsef{ 
return 0; 








Base 代 码 很 简单 ， 实 现 了 Comparable 接 口 ， 根 据 实例 变量 sortOrder 
进行 比较 。Child 代 码 是 : 





class Child extends Base { 
public Child(int sortorder) { 
super(sortorder); 





这 里 ，Child 非 常 简单 ， 只 是 继承 了 Base。 注 意 : Child 没 有 重新 实 
现 Comparable 接 口 ， 因 为 Child 的 比较 规则 和 Base 是 一 样 的 。 我 们 可 能 
望 使 用 前 面 的 max 方 法 操作 Child 容 姻 ， 如 下 所 示 : 





DynamicArray<Child> childs = new DynamicArray<Child>(); 
childs.add(new Child(20)); 

childs.add(new Child(80)); 

Child maxChild = max(childs); 





遗憾 的 是 ，Java 会 提示 编译 错误 ， 类 型 不 匹配 。 为 什么 不 匹配 昵 ? 
我 们 可 能 会 认为 ，Java 会 将 max 方 法 的 类 型 参数 T 推 新 为 Child 类 型 ， 但 
类 型 T 的 要 求 是 extends Comparable<T>， 而 Child 并 没有 实现 
Comparable<Child>， 它 实现 的 是 Comparable<Base>。 


但 我 们 的 需求 是 合理 的 ，Base 类 的 代码 已 经 有 了 关于 比较 所 需要 的 


全 部 数据 ， 它 应 该 可 以 用 于 比较 Child 对 象 。 解 决 这 个 问题 的 方法 ， 就 
古 修 改 max 的 方法 声明 ， 使 用 超 类 型 通配符 ， 如 下 所 示 : 








public static <T extends Comparable<? super T>> T max(DynamicArray<T> arr) 








这 么 修改 一 下 就 可 以 了 ， 这 种 写法 比较 抽象 ， 将 T 莹 换 为 Child， 就 


fi 





Child extends Comparable<? super Child> 





<? super Child> 可 以 匹配 Base， 所 以 整体 就 是 匹配 的 。 


我 们 比较 一 下 类 型 参数 限定 与 超 类 型 通配符 ， 类 型 参数 限定 只 有 
extends 形 式 ， 没 有 super 形 式 ， 比 如 ， 前 面 的 copyTo 方 法 的 通配符 形式 
的 声明 为 : 








public void copyTo(DynamicArray<? super E> dest) 





如 果 类 型 参数 限定 支持 super 形 式 ， 则 应 该 是 : 





public <T super E> void copyTo(DynamicArray<T> dest) 





事实 是 ，Java 并 不 支持 这 种 语法 。 


前 面 我 们 说 过 ， 对 于 有 限定 的 通配符 形式 <? extends E>， 可 以 用 类 
0 但 是 对 于 类 似 上 面 的 超 类 型 通配符 ， 则 无 法 用 类 型 参 
数 蔡 代 。 











8.2.4 通配符 比较 


丁 介绍 了 泛 型 中 的 三 种 通配符 形式 <? >、<? super E> 和 <? 
extends E>， 并 分 析 了 与 类 型 参数 形式 的 区 别 和 联系 ， 它 们 比较 容易 混 
消 ? 我 们 总 结 比较 如 下 : 


1) 它们 的 目的 都 是 为 了 使 方法 接口 更 为 灵活 ， 可 以 接受 更 为 广泛 


的 类 型 。 


2) <? superE> 用 于 灵活 写 入 或 比较 ， 使 得 对 象 可 以 写 入 父 类 型 的 
5 比较 方法 可 以 应 用 于 子 类 对 象 ， 它 不 能 被 类 型 参数 
形式 蔡 代 。 











3) <? > 和 <? extends E> 用 于 灵活 读 取 ， 使 得 方法 可 以 读 取 E 或 上 的 
任意 子 类 型 的 容器 对 象 ， 它 们 可 以 用 类 型 参数 的 形式 蔡 代 ， 但 通配符 形 
式 更 为 简洁 。 


Java 容 器 类 的 实现 中 ， 有 很 多 使 用 通配符 的 例子 ， 比 如 ， 类 
Collections 中 就 有 如 下 方法 : 





public static <T extends Comparable<? super T>> void sort(List<T> list) 
public static <T> void sort(List<T> list, Comparator<? super T> c) 
public static <T> void copy(List<? super T> dest, List<? extends T> src) 
public static <T> T max(Collection<? extends T> coll, 

Comparator<? super T> comp) 





通过 前 面 两 节 ， 我 们 应 该 可 以 理解 这 些 方法 声明 的 含义 了 。 关 于 泛 
型 ， 还 有 一 些 细节 以 及 限制 ， 让 我 们 下 一 节 继续 探讨 。 


8.3 细节 和 局 限 性 


本 节 介 绍 泛 型 中 的 一 些 细节 和 局 限 性 ， 这 些 局 限 性 主要 与 Java 的 实 
现 机 制 有 关 。Java 中 ， 泛 型 是 通过 类 型 探 除 来 实现 的 ， 类 型 参数 在 编译 
时 会 被 蔡 换 为 Object， 运 行 时 Java 虚 拟 机 不 知道 泛 型 这 回 事 ， 这 带 来 了 
其 中 有 的 部 分 是 比较 容易 理解 的 ， 有 的 则 是 非常 违反 直觉 


一 项 技术 ， 往 往 只 有 理解 了 其 局 限 性 ， 才 算是 真正 理解 了 它 ， 才 能 
更 好 地 应 用 它 。 下 面 我 们 将 从 以 下 几 个 方面 来 介绍 这 些 细节 和 局 限 性 : 


.使 用 泛 型 类 、 方 法 和 接口 。 
:定义 泛 型 类 、 方 法 和 接口 。 
: 泛 型 与 数组 。 














8.3.1 ”使 用 泛 型 类 、 方 法 和 接口 





在 使 用 泛 型 类 、 方 法 和 接口 时 ， 有 一 些 值得 注意 的 地 方 ， 比 如 : 
基本 类 型 不 能 用 于 实例 化 类 型 参数 。 

运行 时 类 型 信息 不 适用 于 泛 型 。 

类 型 擦 除 可 能 会 引 友 一 些 冲 突 。 

我 们 逐个 来 看 下 。Java 中 ， 因 为 类 型 参数 会 被 蕉 换 为 Object， 所 以 


0 
法 的 : 











Pair<int> minmax = new Pair<int>(1,100); 





解决 方法 是 使 用 基本 类 型 对 应 的 包装 类 。 


在 介绍 继承 的 实现 原理 时 ， 我 们 提 到 在 内 存 中 每 个 类 都 有 一 份 类 型 
信息 ， 而 每 个 对 象 也 都 保存 着 其 对 应 类 型 信息 的 引用 。 关 于 运行 时 信 
息 ， 后 续 章节 我 们 会 进一步 详细 介绍 ， 这 里 简要 说 明 一 下 。 在 Java 中 ， 
这 个 类 型 信息 也 是 一 个 对 象 ， 它 的 类 型 为 Class，Class 本 里 也 是 一 个 泛 
型 类 ， 每 个 类 的 类 型 对 象 可 以 通过 < 类 名 >.class 的 方式 引用 ， 比 如 
String.class、Integer.class。 这 个 类 型 对 象 也 可 以 通过 对 象 的 getClass () 
方法 获得 ， 比 如 : 











Class<?> cls = "hello".getClass(); 





这 个 类 型 对 象 只 有 一 份 ， 与 泛 型 无 天， 所 以 Java 不 支持 类 似 如 下 写 
法 : 





Pair<Integer>.class 








一 个 泛 型 对 象 的 getClass 方 法 的 返回 值 与 原始 类 型 对 象 也 是 相同 
的 ， 比 如 ， 下 面 代码 的 输出 都 是 true: 





Pair<Integer> p1 = new Pair<Integer>(1,100); 
Pair<String> p2 = new Pair<String>("hello", "world"); 
System,.out.println(Pair.class==p1i.getClass()); //true 
System,.out.println(Pair.class==p2.getClass()); //true 





之 前 ， 我 们 介绍 过 instanceof 关 键 字 ，instanceof 后 面 是 接口 或 类 
名 ，instanceof 是 运行 时 判断 ， 也 与 泛 型 无 关 ， 所 以 ，Java 也 不 支持 类 似 
如 下 写法 : 





if(p1 instanceof Pair<Integer>) 





不 过 ，Java 文 持 如 下 写法 : 





if(p1i instanceof Pair<?>) 





由 于 类 型 擦 除 ， 可 能 会 引发 一 些 编译 冲突 ， 这 些 冲突 初 看 上 去 并 不 
容易 理解 ， 我 们 通过 一 些 例子 介绍 。8.2.3 节 我 们 介绍 过 一 个 例子 ， 有 两 





个 类 Base 和 Child，Base 的 声明 为 : 





class Base implements Comparable<Base> 





Child 的 声明 为 : 





class Child extends Base 





Child 没 有 专 | .实现 Comparable 接 口 ，8.2.3 节 我 们 说 Base 类 已 经 有 了 
比较 所 需 的 全 部 信息 ， 所 以 Child 没 有 必要 实现 ， 可 是 如 果 Child 硕 望 目 
定义 这 个 比较 方法 呢 ? 直觉 上 ， 可 以 这 样 修 改 Child 类 ; 








class Child extends Base implements Comparable<Child>{ 


// 主 体 代码 
} 





遗憾 的 是 ，Java 编 译 右 会 提示 错误 ，Comparable 接 口 不 能 被 实现 两 
次 ， 且 两 次 实现 的 类 型 参数 还 不 同 ， 一 次 是 Comparable<Base>， 一 次 是 
Comparable<Child>。 为 什么 不 允许 呢 ? 因为 类 型 探 除 后 ， 实 际 上 只 能 
有 


那 Child 有 什么 办 法 修改 比较 方法 呢 ? 只 能 是 重 写 Base 类 的 实现 ， 如 
下 所 示 : 








class Child extends Base { 
Q@Override 
public int compareTo(Base 0) { 
if(!(o instanceof Child)){ 
throw new IllegalArgumentException(); 


} 

child c = (Child)o; 
// 比 较 代 码 

return 0,; 





ww 
~ 


// 其 他 代码 





另外 ， 你 可 能 认为 可 以 如 下 定义 重 载 方法 : 





public static void test(DynamicArray<Integer> intArr) 
public static void test(DynamicArray<String> strArr) 





虽然 参数 都 是 DynamicArray， 但 实例 化 类 型 不 同 ， 一 个 是 
DynamicArray<Integer>， 另 一 个 是 DynamicArray<String>， 同 样 ， 遗 憾 
的 是 ，Java 不 允许 这 种 写法 ， 理 由 同样 是 类 型 擦 除 后 它们 的 声明 是 一 样 
的 。 


8.3.2” 定义 没 型 类 、 方 法 和 接口 
在 定义 泛 型 类 、 方 法 和 接口 时 ， 也 有 一 些 需 要 注意 的 地 方 ， 比 如 ; 
.不 能 通过 类 型 参数 创建 对 象 。 
: 泛 型 类 类 型 参数 不 能 用 于 静态 变量 和 方法 。 
:了 解 多 个 类 型 限定 的 语法 。 


我 们 逐个 介绍 。 不 能 通过 类 型 参数 创建 对 象 ， 比 如 ，TI 是 类 型 参 
数 ， 下 面 的 写法 都 是 非法 的 : 





T elm = new T(); 
T[] arr = new T[10]; 





为 什么 非法 呢 ? 因为 如 条 人 允许， 那么 用 户 会 以 为 创建 的 就 是 对 应 类 
型 的 对 象 ， 但 由 于 类 型 擦 除 ，Java 只 能 创建 Object 类 型 的 对 象 ， 而 无 法 
创建 T 类 型 的 对 象 ， 容 易 引 起 误解 ， 所 以 Java 干 脆 禁 止 这 么 做 。 


那 如 果 确 实 希 望 根 据 类 型 创建 对 象 呢 ?需要 设计 API 接 受 类 型 对 
象 ， 即 Class 对 象 ， 并 使 用 Java 中 的 反射 机 制 。 第 21 章 会 介绍 反射 ， 这 里 
简要 说 明 一 下 。 如 果 类 型 有 默认 构造 方法 ， 可 以 调用 Class 的 newInstance 
方法 构建 对 象 ， 类 似 这 样 : 





public static <T> T create(Class<T> type){ 
try { 
return type.newInstance( ); 
} catch (Exception e) { 
return null; 


} 





比如 : 





Date date = create(Date.class); 
StringBuilder sb = create(StringBuilder.class); 





对 于 泛 型 类 声明 的 类 型 参数 ， 可 以 在 实例 变量 和 方法 中 使 用 ， 但 在 
静态 变量 和 静态 方法 中 是 不 能 使 用 的 。 类 似 下 面 这 种 写法 是 非法 的 : 





public class Singleton<T> { 
private static T instance,; 
public synchronized static T getInstance(){ 
if(instance==null){ 
// 创 建 实例 





return instance; 
} 
} 





如 果 合 法 ， 那 么 对 于 每 种 实例 化 类 型 ， 都 需要 有 一 个 对 应 的 静态 变 
量 和 方法 。 但 由 于 类 型 擦 除 ，Singleton 类 型 只 有 一 份 ， 静 态 变量 和 方法 
都 是 类 型 的 属性 ， 且 与 类 型 参数 无 关 ， 所 以 不 能 使 用 泛 型 类 类 型 参数 。 


不 过 ， 对 于 议 态 方法 ， 它 可 以 是 泛 型 方法 ， 可 以 声明 目 己 的 类 型 参 
数 ， 这 个 参数 与 泛 型 类 的 类 型 参数 是 没有 关系 的 。 


之 前 介绍 类 型 参数 限定 的 时 候 ， 我 们 提 到 上 界 可 以 为 茶 个 类 、 茶 个 
接口 或 者 其 他 类 型 参数 ， 但 上 界 都 是 只 有 一 个 ，Java 中 还 文 持 多 个 上 
界 ， 多 个 上 界 之 间 以 & 分 隔 ， 类 似 这 样 : 








T extends Base & Comparable & Serializable 





Base 为 上 界 类 ，Comparable 和 Serializable 为 上 界 接口 。 如 果 有 上 界 
类 ， 类 应 该 放 在 第 一 个 ， 类 型 探 除 时 ， 会 用 第 一 个 上 界 蔡 换 。 


四， 过 型 与 妆 必 


泛 型 与 数组 的 关系 稍微 复杂 一 些 ， 我 们 单独 介绍 。 


引入 泛 型 后 ， 一 个 令 人 惊讶 的 事实 是 ， 不 能 创建 泛 型 数组 。 比 如 ， 
我 们 可 能 想 这 样 创建 一 个 Pair 的 泛 型 数组 ， 以 表示 7.6 节 中 介绍 的 奖励 面 
额 和 权重 。 








Pair<Object, Integer>[] options = new Pair<0Object, Integer>[]f{ 
new Pair("1 元 ",7)，new Pair("2 元 "，2)，new Pair("10 元 "，1) 


}; 








Java 会 提示 编译 错误 ， 不 能 创建 泛 型 数组 。 这 是 为 什么 呢 ? 我 们 先 
来 进一步 理解 一 下 数组 。 

前 面 我 们 解释 过 ， 类 型 参数 之 间 有 继承 关系 的 容器 之 间 是 没有 关系 
的 ， 比 如 ， 一 个 DynamicArray<Integer> 对 象 不 能 赋值 给 一 个 
DynamicArray<Number> 变 量 。 不 过 ， 数 组 是 可 以 的 ， 看 代码 : 





Integer[] ints = new Integer[10]; 
Number[] numbers = ints; 
Object[] objs = ints,; 








后 面 两 种 赋值 都 是 允许 的 。 数 组 为 什么 可 以 呢 ? 数组 是 Java 直 接 文 
持 的 概念 ， 它 知道 数组 元 素 的 实际 类 型 ， 知 道 Object 和 和 Number 都 是 
Integer 的 父 类 型 ， 所 以 这 个 操作 是 允许 的 。 


人 但 如 采 使 用 不 当 ， 可 能 会 引起 运行 时 异 
常 ， 上 0: 








Integer[] ints = new Integer[10]; 
Object[] objs = ints,; 
objs[0] = "hello",; 








a 


编译 是 没有 问题 的 ， 运 行 时 会 抛 出 ArrayStoreException， 因 为 Java 
知道 实际 的 类 型 是 Integer， 上 所 以 写 入 String 会 抛 出 寞 向 。 


理解 了 数组 的 这 个 行为 ， 我 们 再 来 看 泛 型 数组 。 如 果 Java 允 许 创建 
泛 型 数组 ， 则 会 发 生 非常 严重 的 问题 ， 我 们 看 看 具体 会 发 生 什么 : 











Pair<object, Integer>[] options = new Pair<Object,Integer>[3]; 
Object[] objs = options 
objs[0] = new Pair<Double,String>(12.34,"hello"); 





如 果 可 以 创建 泛 型 数组 options， 那 它 就 可 以 赋值 给 其 他 类 型 的 数组 
objs， 而 最 后 一 行 明 显 错误 的 赋值 操作 ， 则 既 不 会 引起 编译 错误 ， 也 不 
会 触发 运行 时 异常 ， 因 为 Pair<Double，String> 的 运行 时 类 型 是 Pair， 和 
objs 的 运行 时 类 型 Pair[] 是 匹配 的 。 但 我 们 知道 ， 它 的 实际 类 型 是 不 匹配 
的 ， 在 程序 的 其 他 地 方 ， 当 把 objs[0] 作 为 Pair<Object，Integer> 进 行 处 理 
的 时 候 ， 一 定 会 触发 异常 。 


也 就 是 说 ， 如 果 人 允许 创建 泛 型 数组 ， 那 就 可 能 会 有 上 面 这 种 错误 操 
作 ， 它 既 不 会 引起 编译 错误 ， 也 不 会 立即 触发 运行 时 异常 ， 却 相当 于 埋 
下 了 一 颗 炸 弹 ， 不 定 什么 时 候 爆 发 ， 为 避免 这 种 情况 ，Java 干 脆 就 茶 止 
创建 泛 型 数组 。 


但 现实 需要 能 够 存放 泛 型 对 象 的 容器 ， 怎 么 办 呢 ? 可 以 使 用 原始 类 
型 的 数组 ， 比 如 : 














Pair[] options = new Pair[]t{ 
new Pair<String,Integer>("1 元 ",7), 
new Pair<String,Integer>("2 元 "，2)， 
new Pair<String,Integer>("10 元 "，1)}， 





更 好 的 选择 是 ， 使 用 后 续 章 节 介 绍 的 泛 型 容器 。 目 前 ， 可 以 使 用 我 
们 自己 实现 的 Dy-namicArray， 比 如 : 





DynamicArray<Pair<String,Integer>> options = new DynamicArray<>(); 
options.add(new Pair<String,Integer>("1 元 ",7)); 
options.add(new Pair<String,Integer>("2 元 ",2)); 
options.add(new Pair<String,Integer>("10 元 ",1)); 





DynamicArray 内 部 的 数组 为 Object 类 型 ， 一 些 操作 插入 了 强制 类 型 
转换 ， 外 部 接口 是 类 型 安全 的 ， 对 数组 的 访问 都 是 内 部 代码 ， 可 以 避免 
误 用 和 类 型 寞 第 。 


有 时 ， 我 们 希望 转换 泛 型 容器 为 一 个 数组 ， 比 如 ， 对 于 
DynamicArray， 我 们 可 能 希望 它 有 这 么 一 个 方法 : 











public E[] toArray() 





而 希望 可 以 这 么 用 : 





DynamicArray<Integer> ints = new DynamicArray<Integer>(); 
ints.add(100); 

ints.add(34); 

Integer[] arr = ints.toArray(); 





先 使 用 动态 容器 收集 一 些 数据 ， 然 后 转换 为 一 个 固定 数组 ， 这 也 是 
一 个 常见 的 合理 需求 ， 怎 么 来 实现 这 个 toArray 方 法 呢 ? 可 能 想 先 这 样 : 








E[] arr = new E[sizel]; 








遗憾 的 是 ， 如 之 前 所 述 ， 这 是 不 合法 的 。Java 运 行 时 根本 不 知道 E 
是 什么 ， 也 就 无 法 做 到 创建 E 类 型 的 数组 。 为 一 种 想法 是 这 样 : 





public E[] toArray(){ 
Object[] copy = new Object[sizel]; 
System.arraycopy(elementData, ©0, copy, 0, size); 
return (E[])copy; 

} 





或 者 使 用 之 前 介绍 的 Arrays 方 法 : 





public E[] toArray(){ 
return (E[])Arrays.copyof(elementData, size); 





结果 都 是 一 样 的 ， 没 有 编译 错误 了， 但 运行 时 会 抛 出 
ClassCastException 异 常 ， 原 因 是 Object 类 型 的 数组 不 能 转换 为 Integer 类 
型 的 数组 。 


那 怎 么 办 呢 ? 可 以 利用 Java 中 的 运行 时 类 型 信息 和 反射 机 制 ， 这 些 
概念 我 们 后 续 章 节 再 详细 介绍 。 这 里 我 们 简要 介绍 下 。Java 必 须 在 运行 
时 知道 要 转换 成 的 数组 类 型 ， 类 型 可 以 作为 参数 传递 给 toArray 方 法 ， 比 
如 : 








public E[] toArray(Class<E> type){ 
Object copy = Array.newInstance(type, size); 
System.arraycopy(elementData，0，copy，0，Size)， 
return (E[])copy; 





Class<E> 表 示 要 转换 成 的 数组 类 型 信息 ， 有 了 这 个 类 型 信息 ， 
Array 类 的 newInstance 方 法 就 可 以 创建 出 真正 类 型 的 数组 对 象 。 调 用 
toArray 方 法 时 ， 需 要 传递 需要 的 类 型 ， 比 如 ， 可 以 这 样 : 





Integer[] arr = ints.toArray(Integer.class); 





我 们 来 稍微 总 结 下 泛 型 与 数组 的 关系 : 
Java 不 文 持 创建 泛 型 数组 。 


:如果 要 存放 泛 型 对 象 ， 可 以 使 用 原始 类 型 的 数组 ， 或 者 使 用 泛 型 
容器 。 


泛 型 容器 内 部 使 用 Object 数组 ， 如 果 要 转换 泛 型 容器 为 对 应 类 型 的 
数组 ， 需 要 使 用 反射 。 


8.34 小 结 





本 节 介 绍 了 泛 型 的 一 些 细节 和 局 限 性 ， 这 些 局 限 性 主要 是 由 于 Java 
泛 型 的 实现 机 制 引 起 的 ， 这 些 局 限 性 包括 : 不 能 使 用 基本 类 型 ， 没 有 运 
行 时 类 型 信息 ， 类 型 探 除 会 引发 一 些 冲 突 ， 不 能 通过 类 型 参数 创建 对 
象 ， 不 能 用 于 静态 变量 等 。 我 们 还 单独 讨论 了 泛 型 与 数组 的 关系 。 


我 们 需要 理解 这 些 局 限 性 ， 笠 运 的 是 ， 一 般 并 不 需要 特别 去 记忆 ， 
因为 用 错 的 时 候 ，Java 开 发 环境 和 编译 圳 会 进行 捉 示 ， 当 被 提示 时 能 够 
理解 并 从 容 应 对 即 可 。 

至 此 ， 关 于 泛 型 的 介绍 就 结束 了 。 泛 型 是 Java 容 器 类 的 基础 ， 理 解 
了 泛 型 ， 接 下 来 ， 就 让 我 们 开始 探索 Java 中 的 容器 类 。 


第 9 革 ”列表 和 队列 


从 本 章 开 始 ， 我 们 探讨 Java 中 的 容 右 类 。 所 谓 容器 ， 顾 名 思 义 束 是 
容纳 其 他 数据 的 。 计 算 机 课程 中 有 一 门 诬 叫 数据 结构 ， 可 以 粗略 对 应 于 
Java 中 的 容器 类 。 容 器 类 可 以 说 是 日 党 程序 开发 中 天 天 用 到 的 ， 没 有 容 
需 类 ， 难 以 想象 能 开发 什么 真正 有 用 的 程序 。 


我 们 不 会 介绍 所 有 数据 结构 的 内 容 ， 但 会 介绍 Java 中 的 主要 实现 。 
在 本 章 中 ， 我 们 先 介绍 关于 列表 和 队列 的 一 些 主要 类 ， 有 具体 包括 
ArrayList、LinkedList 以 及 ArrayDeque， 我 们 会 介绍 它们 的 用 法 、 背 后 
的 实现 原理 、 数 据 结构 和 算法 ， 以 及 应 用 场景 等 。 




















9.1 齐 析 ArrayList 


第 8 章 介 绍 泛 型 的 时 候 ， 我 们 自己 实现 了 一 个 简单 的 动态 数组 容器 
类 DynaArray， 本 市 将 介绍 Java 中 真正 的 动态 数组 容器 类 ArrayList。 本 市 
会 介绍 它 的 基本 用 法 、 迭 代 操 作 、 实 现 的 一 些 接口 (Collection、List 和 
RandAccess) ， 最 后 分 析 它 的 特点 。 





9.1.1 基本 用 法 


ArrayList 是 一 个 泛 型 容器 ， 新 建 ArrayList 需 要 实例 化 泛 型 参数 ， 比 
如 : 





ArrayList<Integer> intList = new ArrayList<Integer>(); 
ArrayList<String> strList = new ArrayList<String>(); 





ArrayList 的 主要 方法 有 : 





Ml 


public boolean add(E e) // 添 加 元 素 到 末 
public boolean isEmpty() // 判 断 是 否 为 空 
public int size() // 获 取 长 度 
public E get(int index) // 访 问 指定 位 置 的 元 素 

public int index0of(0bject o) // 查 找 元 素 ， 如 果 找 到 ， 返 回 索引 位 置 ， 否 则 返回 -1 
public int lastIndex0f(0bject 0o) // 从 后 往 前 找 
public boolean contains(0bject 0) // 是 否 包含 指定 元 素 , 依据 是 equals 方 法 的 返回 值 
public E remove(int index) // 删 除 指定 位 置 的 元 素 ， 返 回 值 为 被 删 对 象 

// 删 除 指 定 对 象 ， 只 删除 第 一 个 相同 的 对 象 ， 返 回 值 表示 是 否 删除 了 元 素 

// 如 果 o 为 nul1， 则 删除 值 为 nu11 的 元 素 

public boolean remove(Object 0o) 

public void clear() // 删 除 所 有 元 素 

// 在 指定 位 置 插入 元 素 ，index 为 0 表示 插入 最 前 面 ，index 为 ArrayList 的 长 度 表示 插 到 最 后 卫 
public void add(int index, E element) 

public E set(int index，E element) // 修 改 指 定位 置 的 元 素 内 容 
















































































































































































这 些 方法 简单 和 直接， 就 不 多 解释 了 ， 我 们 看 个 简单 示例 : 





ArrayList<String> strList = new ArrayList<String>(); 

strList.add(" 老 马 ") 

strList.add(" 编 程 " ) ; 

for(int i=0; i<strList.size(); i++){ 
System.out.printlin(strList.get(i)); 

} 





9.1.2 基本 原理 


可 以 看 出 ，ArrayList 的 基本 用 法 是 比较 简单 的 ， 它 的 基本 原理 也 是 
比较 简单 的 。Array-List 的 基本 原理 与 我 们 在 上 一 章 介绍 的 DynaArray 类 
似 ， 内 部 有 一 个 数组 elementData， 一 般 会 有 一 些 预 留 的 空间 ， 有 一 个 整 
数 size 记 录 实 际 的 元 素 个 数 〈 基 于 Java 7) ， 如 下 所 示 : 








private transient Object[] elementData,; 
private int size,; 





我 们 暂时 可 以 忽略 transient 这 个 关键 字 。 各 种 public 廊 法 内 部 操作 的 
基本 都 是 这 个 数组 和 这 个 整数 ，elementData 会 随 着 实际 元 素 个 数 的 增多 
而 重新 分 配 ， 而 size 则 始终 记录 实际 的 元 素 个 数 。 


0 我 们 具体 来 看 下 add 和 remove 方 法 的 实现 。add 方 法 的 主要 代 
码 为 : 








public boolean add(E e) { 
ensureCapacityInternal(size + 1); 
elementData[size++] = ee; 
return true; 


} 





它 首 先 调用 ensureCapacityInternal 确 保 数组 容量 是 够 的 ， 
ensureCapacityInternal 的 代码 是 : 





private void ensureCapacityInternal(int minCapacity) { 
if(elementData == EMPTY_ELEMENTDATA) { 
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); 


ensureExplicitCapacity(minCapacity); 


} 





它 先 判断 数组 是 不 是 空 的 ， 如 果 是 空 的 ， 则 首次 至 少 要 分 配 的 大 小 
为 DEFAULT_CAPACITY，DEFAULT_CAPACITY 的 值 为 10， 接 下 来 调 
用 ensureExplicitCapacity， 主 要 代码 为 : 





private void ensureExplicitCapacity(int minCapacity) { 
modCount++; 
if(minCapacity - elementData.length > 0) 
grow(minCapacity ) ， 





modCount++ 是 什么 意思 呢 ? modCount 表 示 内 部 的 修改 次 数 ， 
modCount++ 当 然 就 是 增加 修改 次 数 ， 为 什么 要 记录 修改 次 数 呢 ? 我们 
待 会 解释 。 


和 则 调用 grow 方 法 ， 其 主要 代 
人 码 为 : 





private void grow(int minCapacity) { 
int oldCapacity = elementData.1length; 
// 右 移 一 位 相当 于 除 2， 所 以 ，newcapacity 相 当 于 ol1dcapacity 的 1.5 倍 
int newCapacity = oldCapacity + (oldCapacity >> 1); 
// 如 果 扩 展 1.5 倍 还 是 小 于 minCapacity， 就 扩展 为 ninCapacity 
if(newCapacity - minCapacity < 0) 
newCapacity = minCapacity; 
elementData = Arrays.copyof (elementData, newCapacity); 




















代码 中 己 有 注释 说 明 ， 不 再 费 述 。 我 们 再 来 看 remove 方 法 的 代码 : 





public E remove(int index) { 
rangeCheck(index); 
modCount++; 
E oldValue = elementData(index); 
int numMoved = size - index - 1; // 计 算 要 移动 的 元 素 个 数 
if(numMoved > 0) 
System.arraycopy(elementData, index+1, elementData, index, numMoved); 
elementData[--size] = null; // 将 size 减 1， 同 时 释放 引用 以 便 原 对 象 被 垃圾 回收 
return oldValue; 























它 也 增加 了 modCount， 然 后 计算 要 移动 的 元 素 个 数 ， 从 index 往 后 
的 元 素 都 往 前 移动 一 位 ， 实 际 调 用 System.arraycopy 方 法 移动 元 素 。 
elementData[--size]=null; 这 行 代 人 码 将 size 减 1， 同 时 将 最 后 一 个 位 置 设 为 
null， 设 为 null 后 不 再 引用 原来 对 象 ， 如 果 原 来 对 象 也 不 再 被 其 他 对 象 引 
用 ， 束 可 以 被 垃圾 回收 。 


其 他 方法 大 多 是 比较 简单 的 ， 我 们 就 不 次 述 了 。 上 面 的 代码 中 ， 为 
便于 理解 ， 我 们 删 减 了 一 些 边 界 情况 处 理 的 代码 ， 完 整 代码 要 上 星 深 复杂 





一 些 ， 但 接口 一 般 都 是 简单 直接 的 ， 这 吏 是 使 用 容 需 类 的 好 处 ， 这 也 是 
计算 机 程序 中 的 基本 思维 方式 ， 封 效 复 杂 操 作 ， 提 供 简 化 接口 。 





9 3 迭代 


理解 了 ArrayList 的 基本 用 法 和 原理 ， 接 下 来 ， 我 们 来 看 一 个 
ArrayList 的 常见 操作 : 友 代 。 我 们 看 一 个 迭代 操作 的 例子 ， 循 环 打 印 
ArrayList 中 的 每 个 元 素 ，ArrayList 文 持 foreach 语 法 : 





ArrayList<Integer> intList = new ArrayList<Integer>(); 
intList.add(123); 
intList.add(456); 
intList.add(789); 
for(Integer a : intList){ 
System.out.printin(a); 
} 





当然 ， 这 种 循环 也 可 以 使 用 如 下 代码 实现 : 





for(int i=0; i<intList.size(); i++ 
System.out.println(intList.get(i)); 
} 





不 过 ，foreach 看 上 去 更 为 人 简洁， 而 且 它 适用 于 各 种 容器 ， 更 为 通 
用 。 


这 种 foreach 语 法 背后 是 怎么 实现 的 呢 ? 其 实 ， 编 译 堪 会 将 它 转换 为 
类 似 如 下 代码 : 








Iterator<Integer> it = IntList,Iterator()， 

while(it.hasNext()){ 
System.out.printin(it.next()); 

} 





接 下 来 ， 我 们 解释 其 中 的 代码 。 
1. 和 迭代 器 接 口 


ArrayList 实 现 了 Iterable 接 口 ，Iterable 表 示 可 迭代 ，Java 7 中 的 定义 





public interface Iterable<T> { 
Iterator<T> iterator(); 


} 





定义 很 简单 ， 就 是 要 求实 现 iterator 方 法 。iterator 方 法 的 声明 为 : 





public Iterator<E> iterator() 





它 返 回 一 个 实现 了 Tterator 接 口 的 对 象 ，Java 7 中 Iterator 接 口 的 定义 
为 : 





public interface Iterator<E> { 
boolean hasNext(); 
E next(); 
void remove( ); 


} 








hasNext《〈) 判断 是 否 还 有 元 系 未 访问，next() 返回 下 一 个 元 素 ， 
remove〈) 删除 最 后 返回 的 元 素 ， 只 读 访问 的 基本 模式 类 似 于 : 








Iterator<Integer> it = IntList,Iterator()， 

while(it.hasNext())t{ 
System.out.printin(it.next()); 

} 





我 们 符 会 再 看 迭代 中 间 要 删除 元 系 的 情况 。 

只 要 对 象 实 现 了 Iterable 接 口 ， 就 可 以 使 用 foreach 语 法 ， 编 译 器 会 转 
换 为 调用 Iterable 和 Iterator 接 口 的 方法 。 初 次 见 到 Iterable 和 Iterator， 可 能 
会 比较 容易 混淆 ， 我 们 再 洪 清 一 下 : 


:Iterable 表 示 对 象 可 以 被 欠 代 ， 它 有 一 个 方法 iterator () ， 返 回 
Iterator 对 象 ， 实 际 通过 Iterator 接 口 的 方法 进行 遍历 ; 


.如 果 对 象 实现 了 Iterable， 就 可 以 使 用 foreach 语 法 ; 


.类 可 以 不 实现 Tterable， 也 可 以 创建 Iterator 对 象 。 

需要 了 解 的 是 ，Java 8 对 Tterable 添 加 了 默认 方法 forEach 和 
spliterator， 对 Iterator 增 加 了 默认 方法 forEachRemaining 和 remove， 具 体 
可 参见 API 文 要 ， 我 们 就 不 介绍 了 。 
2.ListIterator 


除了 iterator 〈) ，ArrayList 还 提供 了 两 个 返回 Iterator 接 口 的 方法 : 





public ListIterator<E> listIterator() 
public ListIterator<E> listIiterator(int index) 





ListIterator 扩 展 了 Iterator 接 口 ， 增 加 了 一 些 方法 ， 同 前 裔 历 、 添 加 
元 系 、 修 改元 素 、 返 回 索引 位 置 等 ， 添 加 的 方法 有 : 











public interface ListIterator<E> extends Iterator<E> { 
boolean hasPrevious(); 
E previous(); 
int nextIndex( ) ， 
int previousIndex(); 
void set(E e); 
void add(E e); 





listIterator 〈) 方法 返回 的 欠 代 器 从 0 开始 ， 而 listIterator (int 
index) 方法 返回 的 迭代 器 从 指定 位 置 index 开 始 。 比 如 ， 从 末尾 往 前 遍 
历 ， 代 码 为 : 





public void reverseTraverse(List<Integer> list){ 
ListIterator<Integer> it = list.listIiterator(list.size()); 
while(it.hasprevious()){ 
System.out.println(it.previous()); 
} 
} 





3. 达 代 的 陷阱 


关于 办 代 器 ， 有 一 种 常见 的 误 用 ， 就 是 在 迭代 的 中 间 调 用 容器 的 删 
除 方法 。 比 如 ， 要 删除 一 个 整数 ArrayList 中 所 有 小 于 100 的 数 ， 直 觉 


上 ， 代 码 可 以 这 么 写 : 





public void remove(ArrayList<Integer> JIist){ 
for(Integer a : list){ 
if(a<=100){ 
list.remove(a); 
} 
} 
} 





但 运行 时 会 抛 出 腊 币 : 





java.util.ConcurrentModificationException 








发 生 了 并 发 修改 异常， 为 什么 呢 ? 因 为 碗 代 器 内 部 会 维护 一 些 索 引 
位 置 相 关 的 数据 ， 要 求 在 达 代 过 程 中 ， 容 右 不 能 发 生 结 构 性 变化 ， 否 则 
这 些 索 引 位 置 就 失效 了 。 所 谓 结构 性 变化 就 是 添加 、 插 入 和 删除 元 素 ， 
只 是 修改 元 素 内 容 不 算 结构 性 变化 。 


如 何 避 免 异 各 呢 ? 可 以 使 用 欠 代 融 的 remove 方 法 ， 如 下 所 示 : 











public static void remove(ArrayList<Integer> list){ 
Iterator<Integer> it = list.iterator(); 
while(it.hasNext())t{ 
if(it.next()<=100){ 
it.remove( ); 
} 
} 
} 





迭代 器 如 何 知道 发 生 了 结构 性 变化 ， 并 抛 出 异常 ? 它 目 己 的 remove 
方法 为 何 又 可 以 使 用 呢 ? 我 们 需要 看 下 友 代 器 实现 的 原理 。 


4. 欠 代 器 实现 的 原理 
我 们 来 看 下 ArrayList 中 iterator 方 法 的 实现 ， 代 码 为 : 





public Iterator<E> iterator() { 
return new Itr(); 
} 





新 建 了 一 个 Itr 对 象 ，Itr 是 一 个 成 员 内 部 类 ， 实 现 了 Iterator 接 口 ， 声 
明 为 : 





private class Itr implements Iterator<E> 








它 有 三 个 实例 成 员 变 量 ， 为 : 














int cursor; // 下 一 个 要 返回 的 元 素 位 置 
int lastRet = -1; // 最 后 一 个 返回 的 索引 位 置 ， 如 果 没有 ， 为 -1 
int expectedModCount = modCount; 





















































cursor 表 示 下 一 个 要 返回 的 元 素 位 置 ，lastRet 表 示 最 后 一 个 返回 的 
索引 位 置 ，expected-ModCount 表 示 期 望 的 修改 次 数 ， 初 始 化 为 外 部 类 
当前 的 修改 次 数 modCount， 回 顾 一 下 ， 成 员 内 部 类 可 以 直接 访问 外 部 
类 的 实例 变量 。 每 次 友 生 结构 性 变化 的 时 候 modCount 都 会 增加 ， 而 每 
次 迭代 器 操作 的 时 候 都 会 检查 expectedModCount 是 否 与 modCount 相 同 ， 
这 样 束 能 检测 出 结构 性 变化 。 


我 们 来 具体 看 下 ， 它 是 如 何 实现 Iterator 接 口中 的 每 个 方法 的 ， 先 看 
hasNext〈() ， 代 码 为 : 











public boolean hasNext() { 
return cursor != size,; 





cursor 与 size 比 较 ， 比 较 直 接 ， 看 next 方 法 : 





public E next() { 
checkForComodification(); 
int i = cursor; 
if(i >= size) 
throw new NoSuchElementException(); 
Object[] elementData = ArrayList.this.elementData,; 
if(i >= elementData.length) 
throw new ConcurrentModificationException(); 
cursor =i+1; 
return (E) elementData[lastRet = i]; 





首先 调用 了 checkForComodification， 它 的 代码 为 : 





final void checkForComodification() { 
if(modCount != expectedModCount) 
throw new ConcurrentModificationException(); 











所 以 ，next 前 面部 分 主要 就 是 在 检查 是 否 发 生 了 结构 性 变化 ， 如 果 
没有 变化 ， 就 更 新 cursor 和 1lastRet 的 值 ， 以 保持 其 语义 ， 然 后 返回 对 应 
的 元 素 。remove 的 代码 为 : 








public void remove() { 
if(lastRet < 0) 
throw new IllegalStateException(); 
checkForComodification(); 
try { 
ArrayList.this.remove(lastRet); 
cursor = lastRet,; 
lastRet = -1; 
expectedModCount = modCount,; 
} catch (IndexOutOfBoundsException ex) { 
throw new ConcurrentModificationException(); 
} 








它 调 用 了 ArrayList 的 remove 方 法 ， 但 同时 更 新 了 cursor、lastRet 和 和 
expectedModCount 的 值 ， 所 以 它 可 以 正确 删除 。 不 过 ， 需 要 注意 的 是 ， 
调用 remove 方 法 前 必须 先 调 用 next， 比 如 ， 通 过 迭代 器 删除 所 有 元 素 ， 

党 上 ， 可 以 这 人 么 与 : 





public static void removeAll(ArrayList<Integer> list){ 
Iterator<Integer> it = list.iterator(); 
while(it.hasNext()){ 
it.remove( ); 





Se 


实际 运行 ， 会 抛 出 异常 java.lang.HlegalStateException， 正 确 写法 
日 
人 EE: 





public static void removeAll(ArrayList<Integer> list){ 
Iterator<Integer> it = list.iterator(); 
while(it.hasNext()){ 
it.next(); 
it.remove(); 


当然 ， 如 果 只 是 要 删除 所 有 元 素 ，ArrayList 有 现成 的 方法 


clear () 。 


listIterator 〈) 的 实现 使 用 了 另 一 个 内 部 类 ListItr， 它 继承 自 Itr， 基 
本 思路 类 似 ， 我 们 就 不 殉 述 了 。 


5. 人 迄 代 器 的 好 处 


为 什么 要 通过 迭代 器 这 种 方式 访问 元 闵 呢 ? 直接 使 用 
size〈) /get (index) 语法 不 也 可 以 吗 ? 在 一 些 场景 下 ， 确 实 没有 什么 
差别 ， 两 者 都 可 以 。 不 过 ，foreach 语 法 更 为 简洁 一 些 ， 更 重要 的 是 ， 旭 
代 器 语法 更 为 通用 ， 它 适用 于 各 种 容器 类 。 


此 外 ， 和 迭代 器 表示 的 是 一 种 关注 点 分 离 的 思想 ， 将 数据 的 实际 组 织 
方式 与 数据 的 迭代 遇 历 相 分 离 ， 是 一 种 币 见 的 设计 模式 。 需要 访问 容 
器 元 素 的 代码 只 需要 一 个 Iterator 接 口 的 引用 ， 不 需要 关注 数据 的 实际 组 
织 方 式 ， 可 以 使 用 一 致 和 统一 的 方式 进行 访问 。 


而 提供 Iterator 接 口 的 代码 了 解数 据 的 组 织 方式 ， 可 以 提供 高 效 的 实 
现 。 在 ArrayList 中 ，size/get (index) 语法 与 迄 代 器 性 能 是 差不多 的 ， 但 
在 后 续 介 绍 的 其 他 容器 中 ， 则 不 一 定 ， 比 如 LinkedList， 和 迭代 器 性 能 项 
要 局 很 多 。 


从 封 朔 的 思路 上 讲 ， 返 代 需 封装 了 各 种 数据 组 织 方式 的 迭代 操作 ， 
提供 了 简单 和 一 致 的 接口 。 








9.1.4 ”ArrayList 实 现 的 接口 





Java 的 各 种 容器 类 有 一 些 共性 的 操作 ， 这 些 共性 以 接口 的 方式 体 
现 ， 我 们 刚刚 介绍 的 Iterable 接 口 就 是 ， 此 外 ，ArrayList 还 实现 了 三 个 主 
要 的 接口 : Collection、List 和 Random-Access， 我 们 逐个 介绍 。 
1.Collection 


Collection 表 示 一 个 数据 集合 ， 数 据 间 没有 位 置 或 顺序 的 概念 ，Java 
7 中 的 接口 定义 为 : 





nn | 


public interface Collection<E> extends Iterable<E> { 
int size(); 
boolean isEmpty(); 
boolean contains(Object 0); 
Iterator<E> iterator(); 
Object[] toArray(); 
<T> T[] toArray(T[] a); 
boolean add(E e); 
boolean remove(Object 0); 
boolean containsAll(Collection<?> c); 
boolean addAll(Collection<? extends E> c); 
boolean removeAll(Collection<?> c); 
boolean retainAll(Collection<?> c); 
void clear(); 
boolean equals(0Object 0); 
int hashCode(); 





这 些 方 法 中 ， 除 了 两 个 toArray 方 法 和 几 个 xxxAll () 方法 外 ， 其 他 
我 们 已 经 介绍 过 了 。toArray 方 法 我 们 符 会 再 介绍 。 这 几 个 xxxAll〈) 方 
法 的 含义 基本 也 是 可 以 顾名思义 的 ，addAll 表 示 添 加 ，removeAll 表 示 市 
除 ，containsAll 表 示 检 查 是 否 包 含 了 参数 容 右 中 的 所 有 元 素 ， 只 有 全 包 
含 才 返 回 true，retainAll 表 示 只 保留 参数 容 右 中 的 元 素 ， 其 他 元 素 会 进行 
删除 。Java 8 对 Collection 接 口 添加 了 几 个 默认 方法 ， 包 括 removelf、 
stream、 spliterator 等 ， 具 体 可 参见 API 文 档 。 











抽象 类 AbstractCollection 对 这 几 个 方法 都 提供 了 默认 实现 ， 实 现 的 
方式 就 是 利用 迭代 器 方法 逐个 操作 。 比 如 ， 我 们 看 removeAll 方 法 ， 代 
人 码 为 : 





public boolean removeAll(Collection<?> c) { 
boolean modified = false,; 
Iterator<?> it = iterator(); 
while(it.hasNext()) { 
if(c.contains(it.next())) { 
it.remove(); 
modified = true; 
} 
} 


return modified; 





代码 比较 简单 ， 就 不 解释 了 。ArrayList 继 承 了 AbstractList， 而 
AbstractList 又 继承 了 AbstractCollection，ArrayList 对 其 中 一 些 方法 进行 
了 重 写 ， 以 提供 更 为 高 效 的 实现 ， 有 基体 不 再 介绍 。 





2.List 


List 表 示 有 顺序 或 位 置 的 数据 集合 ， 它 扩展 了 Collection， 增 加 的 主 
要 方法 有 (Java 7) : 





boolean addAll(int index, Collection<? extends E> c); 
E get(int index); 

E set(int index, E element); 

void add(int index, E element); 

E remove(int index); 

int indexof(Object 0o); 

int lastIindexof(Object 0); 

ListIterator<E> listIiterator(); 

ListIiterator<E> listIterator(int index); 

List<E> subList(int fromIndex, int toIndex); 





这 些 方 法 都 与 位 置 有 关 ， 容 易 理 解 ， 就 不 介绍 了 。Java 8 对 List 接 口 
增加 了 几 个 默认 方法 ， 包 括 sort、replaceAl 和 spliterator; Java 9 增加 了 
多 个 重 载 的 of 方法 ， 可 以 根据 一 个 或 多 个 元 素 生 成 一 个 不 变 的 List， 具 
体 就 不 介绍 了 人 ， 可 参看 API 文 档 。 


3.RandomAccess 


RandomAccess 的 定义 为 : 





public interface RandomAccess { 





没有 定义 任何 代码 。 这 有 什么 用 呢 ? 这 种 没有 任何 代码 的 接口 在 
Java 中 被 称 为 标记 接口 ， 用 于 声明 类 的 一 种 属性 。 


这 里 ， 实 现 了 RandomAccess 接 口 的 类 表示 可 以 随机 访问 ， 可 随机 
访问 就 是 具备 类 似 数组 那样 的 特性 ， 数 据 在 内 存 是 连续 存放 的 ， 根 据 索 
引 值 就 可 以 直接 定位 到 具体 的 元 素 ， 访 问 效率 很 高 。 下 节 我 们 会 介绍 
LinkedList， 它 就 不 能 随机 访问 。 


有 没有 声明 RandomAccess 有 什么 关系 呢 ? 主要 用 于 一 些 通 用 的 算 
法 代码 中 ， 它 可 以 根据 这 个 声明 而 选择 效率 更 高 的 实现 。 比 如 ， 
Collections 类 中 有 一 个 方法 binarySearch， 在 List 中 进行 二 分 查找 ， 它 的 
实现 代码 就 根据 list 是 否 实现 了 RandomAccess 而 采用 不 同 的 实现 机 制 |， 

















如 下 所 示 : 





public static <T> 
int binarySearch(List<? extends Comparable<? super T>> list, T key) 
if(list instanceof RandomAccess || list,.size()<BINARYSEARCH_THRESHOLD) 
return Collections,.indexedBinarySearch(list, key); 
else 
return Collections.iteratorBinarySearch(list, key); 





9.1.5 ”ArrayList 的 其 他 方法 


ArrayList 中 还 有 一 些 其 他 方法 ， 包 括 构 造 方 法 、 与 数组 的 相互 转 
换 、 容 量 大 小 控制 等 ， 我 们 来 看 下 。ArrayList 还 有 两 个 构造 方法 : 





public ArrayList(int initialCapacity) 
public ArrayList(Collection<? extends E> c) 





一 个 方法 以 指定 的 大 小 initialCapacity 初 始 化 内 部 的 数组 大 小 ， 代 
码 为 : 





this.elementData = new Object[initialCapacity]; 





在 事先 知道 元 系 长 度 的 情况 下 ， 或 者 ， 预 完 知道 长 度 上 限 的 情况 
下 ， 使 用 这 个 构造 方法 可 以 避免 重新 分 配 和 复制 数组 。 第 二 个 构造 方法 
以 一 个 已 有 的 Collection 构 建 ， 数 据 会 新 复制 一 份 。 


ArrayList 中 有 两 个 方法 可 以 返回 数组 : 





public Object[] toArray() 
public <T> T[] toArray(T[] a) 





第 一 个 方法 返回 是 Object 数 组 ， 代 码 为 : 





public Object[] toArray() { 
return Arrays.copyof(elementData, size); 


第 二 个 方法 返回 对 应 类 型 的 数组 ， 如 果 参 数 数 组 长 度 足 以 容纳 所 有 
元 素 ， 束 使 用 该 数组 ， 否 则 就 新 建 一 个 数组 ， 比 如 : 





ArrayList<Integer> intList = new ArrayList<Integer>(); 
intList.add(123); 

intList.add(456); 

intList.add(789); 

Integer[] arrA = new Integer[3]; 
intList.toArray(arrA); 

Integer[] arrB = intList.toArray(new Integer[0]); 
System,.out.println(Arrays.equals(arrA, arrB)); 





输出 为 tue， 表 示 两 种 方式 都 是 可 以 的 。 
Arrays 中 有 一 个 静态 方法 asList 可 以 返回 对 应 的 List， 如 下 所 示 : 





Integer[] a = {1,2,3}; 
List<Integer> list = Arrays.asList(a); 





需要 注意 的 是 ， 这 个 方法 返回 的 List， 它 的 实现 类 并 不 是 本 节 介 绍 
的 ArrayList， 而 是 Arrays 类 的 一 个 内 部 类 ， 在 这 个 内 部 类 的 实现 中 ， 内 
部 用 的 数组 就 是 传 入 的 数组 ， 没 有 拷贝 ， 也 不 会 动态 改变 大 小 ， 所 以 对 
数组 的 修改 也 会 反映 到 List 中 ， 对 List 调 用 add、remove 方 法 会 抛 出 异 
常 。 


要 使 用 ArrayList 完 整 的 方法 ， 应 该 新 建 一 个 ArrayList， 如 下 所 示 : 





List<Integer> list = new ArrayList<Integer>(Arrays.asList(a)); 





ArrayList 还 提供 了 两 个 public 方 法 ， 可 以 控制 内 部 使 用 的 数组 大 


小 ， er 





public void ensureCapacity(int minCapacity) 





它 可 以 确保 数组 的 大 小 至 少 为 minCapacity， 如 果 不 够 ， 会 进行 扩 
展 。 如 果 已 经 预知 ArrayList 需 要 比较 大 的 容量 ， 调 用 这 个 方法 可 以 减少 
ArrayList 内 部 分 配 和 扩展 的 次 数 。 


月 一 个 方法 是 ， 





public void trimToSize() 


它 会 重新 分 配 一 个 数组 ， 大 小 刚好 为 实际 内 容 的 长 度 。 调 用 这 个 方 
法 可 以 节省 数组 占用 的 空间 。 


9.1.6 ”ArrayList 特 点 分 析 





后 续 我 们 会 介绍 各 种 容器 类 和 数据 组 织 方 式 。 之 所 以 有 各 种 不 同 的 
方式 ， 是 因为 不 同方 式 有 不 同 特点 ， 而 不 同 特点 有 不 同 适用 场合 。 考 虑 
特点 时 ， 性 能 是 其 中 一 个 很 重要 的 部 分 ， 但 性 能 不 是 一 个 简单 的 高 低 之 
分 ， 对 于 一 种 数据 结构 ， 有 的 操作 性 能 高 ， 有 的 操作 性 能 比较 低 。 


作为 程序 员 ， 就 是 要 理解 每 种 数据 结构 的 特点 ， 根 据 场合 的 不 同 ， 
选择 不 同 的 数据 结构 。 


对 于 ArrayList， 它 的 特点 是 内 部 采用 动态 数组 实现 ， 这 决定 了 以 下 
点 。 





1) 可 以 随机 访问 ， 按 照 索引 位 置 进 行 访问 效率 很 高 ， 用 算法 描述 
中 的 术语 ， 效 率 是 O(1) ， 简 单 说 就 是 可 以 一 步 到 位 。 

2) 除非 数组 已 排序， 人 否则 按照 内 容 奋 找 元 素 效率 比较 低 ， 有 具体 是 
O(N) ，N 为 数组 内 容 长 度 ， 也 就 是 次 ， 性 能 与 数组 长 度 成 正比 。 

3) 添加 元 素 的 效率 还 可 以 ， 重 新 分 配 和 复制 数组 的 开销 被 平反 
了 ， 具 体 来 说 ， 添 加 N 个 元 素 的 效率 为 O(N) 。 


4) 插入 和 删除 元 素 的 效率 比较 低 ， 因 为 需要 移动 元 系 ， 具 体 为 
O (CN) 。 














下 7 才 站 








本 节 详 细 介 绍 了 ArrayList，ArrayList 是 日 常 开发 中 最 常用 的 类 之 
一 。 我 们 介绍 了 ArrayList 的 用 法 、 基 本 实现 原理 、 和 迭代 器 及 其 实现 、 


Collection/List/RandomAccess 接 口 、ArrayList 与 数组 的 相互 转换 ， 最 后 
分 析 了 ArrayList 的 特点 。 


需要 说 明 的 是 ，ArrayList 不 是 线程 安全 的 ， 关 于 线程 我 们 在 第 15 章 
介绍 ， 实 现 线程 安全 的 一 种 方式 是 使 用 Collections 提 供 的 方法 装饰 
ArrayList, 这 个 我 们 会 在 12.2 节 介绍 。 此 外 ， 需 要 了 解 的 是 ， 还 有 一 个 
类 Vector， 它 是 Java 最 早 实现 的 容器 类 之 一 ， 也 实现 了 List 接 口 ， 基 本 原 
理 与 ArrayList 类 似 ， 内 部 使 用 synchronized 〈15.2 节 介绍 ) 实现 了 线程 安 
全 ， 不 需要 线程 安全 的 情况 下 ， 推 荐 使 用 ArrayList。 


ArrayList 的 插入 和 删除 的 性 能 比较 低 ， 下 一 节 ， 我 们 来 看 男 一 个 同 
样 实 现 了 List 接 口 的 容器 类 : LinkedList， 它 的 特点 可 以 说 与 ArrayList 正 
好 相反 。 


9.2 ” 训 析 LinkedList 





ArrayList 随 机 访问 效率 很 高 ， 但 插入 和 删除 性 能 比较 低 ; 
LinkedList 同 样 实现 了 List 接 口 ， 它 的 特点 与 ArrayList 几 乎 正好 相反 ， 本 
市 我 们 就 来 详细 介绍 LinkedList。 

除了 实现 了 List 接 口外 ，LinkedList 还 实现 了 Deque 和 Queue 接 口 ， 可 


以 按照 队列 、 栈 和 双 端 队列 的 方式 进行 操作 。 本 市 会 介绍 这 些 用 法 ， 同 
时 介绍 其 实现 原理 。 我 们 先 来 看 它 的 用 法 。 


9.2.1 用 法 


LinkedList 的 构造 方法 与 ArrayList 类 似 ， 有 两 个 : 一 个 是 默认 构造 
方法 ， 男 外 一 个 可 以 接受 一 个 已 有 的 Collection， 如 下 所 示 : 





public LinkedList() 
public LinkedList(Collection<? extends E> c) 





比如 ， 可 以 这 么 创建 : 





List<String> list = new LinkedList<>(); 
List<String> list2 = new LinkedList<>( 
Arrays.asList(new String[]{"a","b","c"})); 





LinkedList 与 ArrayList 一 样 ， 同 样 实现 了 List 接 口 ， 而 List 接 口 扩展 
了 Collection 接 口 ，Collection 又 扩展 了 Iterable 接 口 ， 所 有 这 些 接口 的 方 
法 都 是 可 以 使 用 的 ， 使 用 方法 与 上 节 介 绍 的 一 样 ， 本 节 不 再 歼 述 。 
LinkedList 还 实现 了 队列 接口 Queue， 所 谓 队 列 就 类 似 于 日 常生 活 中 的 各 
J ， 在 尾部 添加 元 素 ， 从 头 部 删除 元 素 ， 它 的 
交口 定义 为 : 





public interface Queue<E> extends Collection<E> { 
boolean add(E e); 
boolean offer(E e); 
E remove(); 
E poll(); 


E element() 
E peek(); 
Queue 扩 展 了 Collection， 它 的 主要 操作 有 三 个 : 
:在 尾部 添加 元 素 (add、offer) ; 
.查看 头 部 元 素 〈element、peek) ， 返 回头 部 元 素 ， 但 不 改变 队 





列 ; 
:删除 头 部 元 素 remove、poll) ， 返 回头 部 元 素 ， 并 且 从 队列 中 删 
除 。 


每 种 操作 都 有 两 种 形式 ， 有 什么 区 别 呢 ?区 别 在 于 ， 对 于 特殊 情况 
的 处 理 不 同 。 特 殊 情 况 是 指 队 列 为 空 或 者 队列 为 满 ， 为 空 容易 理解 ， 为 
满 是 指 队 列 有 长 度 大 小 限制 ， 而 且 已 经 占 满 了 。LinkedList 的 实现 中 ， 
队列 长 度 没 有 限制 ， 但 别 的 Queue 的 实现 可 能 有 。 在 队列 为 空 时 ， 
element 和 remove 会 抛 出 异常 NoSuchElementException， 而 peek 和 poll 返 
回 特殊 值 null; 在 队列 为 满 时 ，add 会 殷 出 异常 HlegalStateException， 而 
offer 只 是 返回 false。 


把 LinkedList 当 作 Queue 使 用 也 很 简单 ， 比 如 ， 可 以 这 样 : 








Queue<String> queue = new LinkedList<>(); 

queue.offer("a"); 

queue.offer("b"); 

queue.offer("c"); 

while(queue.peek()!=null)t{ 
System.out.printlin(queue.poll()); 

} 


输出 有 三 行 ， 依 次 为 a、b 和 c。 


我 们 在 介绍 函数 调用 原理 的 时 候 介 绍 过 栈 。 栈 也 是 一 种 常用 的 数据 
结构 ， 与 队列 相反 ， 它 的 特点 是 先进 后 出 、 后 进 先 出 ， 类 似 于 一 个 储 物 
箱 ， 放 的 时 候 是 一 件 件 往 上 放 ， 拿 的 时 候 则 上 只 能 从 上 面 开始 拿 。Java 中 
没有 单独 的 栈 接口 ， 栈 相关 方法 包括 在 了 表示 双 端 队列 的 接口 Deque 
hy 主要 有 三 











void push(E e); 
E pop(); 
E peek(); 





解释 如 下 。 


1) push 表 示 入 栈 ， 在 头 部 添加 元 素 ， 栈 的 空间 可 能 是 有 限 的 ， 如 
果 栈 满 了 ，push 会 抛 出 异常 llegalStateException 。 


2) pop 表 示 出 栈 ， 返 回头 部 元 素 ， 并 且 从 栈 中 删除 ， 如 果 栈 为 空 ， 


会 抛 出 异常 NoSuch-ElementException。 
3) peek 得 看 栈 头 部 元 素 ， 不 修改 栈 ， 如 果 栈 为 空 ， 返 回 nul]。 
把 LinkedList 当 作 栈 使 用 也 很 简单 ， 比 如 ， 可 以 这 样 : 








Deque<String> stack = new LinkedList<>(); 

stack.push("a"); 

stack.push("b"); 

stack.push("c"); 

while(stack.peek()!=null)t{ 
System.out.printin(stack.pop()); 

} 





和 输出 有 三 行 ， 依 次 为 c、b 和 ae。 


Java 中 有 一 个 类 Stack， 单 词 意思 是 栈 ， 它 也 实现 了 栈 的 一 些 方法 ， 
如 push/pop/peek 等 ， 但 它 没有 实现 Deque 接 口 ， 它 是 Vector 的 子 类 ， 它 增 
加 的 这 些 方法 也 通过 synchronized 实 现 了 线程 安全 ， 具 体 就 不 介绍 了 。 
不 需要 线程 安全 的 情况 下 ， 推 荐 使 用 LinkedList 或 下 节 介 绍 的 
ArrayDeque。 


栈 和 队列 都 是 在 两 端 进行 操作 ， 栈 只 操作 头 部 ， 队 列 两 端 都 操作 ， 
但 尾部 只 添加 、 头 部 只 查看 和 删除 。 有 一 个 更 为 通用 的 操作 两 端的 接口 
Deque。Deque 扩 展 了 Queue， 包 括 了 栈 的 操作 方法 ， 此 外 ， 它 还 有 如 下 
更 为 明确 的 操作 两 端的 方法 : 





void addFirst(E e); 
void addLast(E e); 
E getFirst(); 
E getLast(); 


boolean offerFirst(E e); 
boolean offerLast(E e); 
E peekFirst(); 

E peekLast(); 

E pollFirst(); 

E pollLast(); 

E removeFirst(); 

E removeLast(); 





XXXFirst 操 作 头 部 ，xxxLast 操 作 尾 部 。 与 队列 类 似 ， 每 种 操作 有 两 
种 形式 ， 区 别 也 是 在 队列 为 空 或 满 时 处 理 不 同 。 为 空 时 ， 
getXXX/removeXXX 会 抛 出 异常 ， 而 peekXXX/pollXXX 会 返回 null。 队 
列 满 时 ，addXXX 会 抛 出 异常 ，offerXXX 只 是 返回 false。 


栈 和 队列 只 是 双 端 队列 的 特殊 情况 ， 它 们 的 方法 都 可 以 使 用 双 端 队 
列 的 方法 蔡 代 ， 不 过 ， 使 用 不 同 的 名 称 和 方法 ， 概 念 上 更 为 清晰 。 


Deque 接 口 还 有 一 个 迭代 圳 方法， 可 以 从 后 往 前 过 历 : 





Iterator<E> descendingIterator(); 





比如 ， 看 如 下 代码 : 





Deque<String> deque = new LinkedList<>( 
Arrays.asList(new String[]{"a","b","c"})); 
Iterator<String> it = deque.descendingIterator(); 
while(it.hasNext()){ 
System.out.print(it.next()+" "); 








} 
输出 为 : 
C b a 





简单 总 结 下 : LinkedList 的 用 法 是 比较 简单 的 ， 与 ArrayList 用 法 类 
似 ， 支 持 List 接 口 ， 只 是 ，LinkedList 增 加 了 一 个 接口 Deque， 可 以 把 它 
看 作 队 列 、 栈 、 双 端 队 列 ， 方 便 地 在 两 端 进行 操作 。 如 果 只 是 用 作 
List， 那 应 该 用 ArrayList 还 是 LinkedList 呢 ? 我 们 需要 了 解 LinkedList 的 
实现 原理 。 


9.2.2 ”实现 原理 


我 们 先 来 看 LinkedList 的 内 部 组 成 ， 然 后 分 析 它 的 一 些 主要 方法 的 
实现 ， 代 码 基 于 Java 7。 


1. 内 部 组 成 


我 们 知道 ，ArrayList 内 部 是 数组 ， 元 素 在 内 存 是 连续 存放 的 ， 但 
LinkedList 不 是 。LinkedList 直 译 束 是 链表 ， 确 切 地 说 ， 它 的 内 部 实现 是 
双 问 链表 ， 每 个 元 素 在 内 存 都 是 单独 存放 的 ， 元 素 之 间 通 过 链接 连 在 
一 起 ， 类 似 于 小 朋友 之 间 手 拉手 一 样 。 


为 了 表示 链接 关系 ， 需 要 一 个 广 点 的 概念 。 节 点 包括 实际 的 元 
素 ， 但 同时 有 两 个 链接 ， 分 别 指 癌 前 一 个 节点 前驱 〉 和 后 一 个 节点 
(后 继 ) 。 节 后 是 一 个 内 部 类 ， 具 体 定义 为 : 














private static class Node<E> { 
E item; 
Node<E> next; 
Node<E> prev; 
Node(Node<E> prev, E element, Node<E> next) { 
this.item = element,; 
this.next = next; 
this.prev = prev; 
} 
} 





Node 类 表示 节点 ，item 指 癌 实 际 的 元 素 ，next 指 问 后 一 个 节点 ， 
prev 指 癌 前 一 个 节点 。 


LinkedList 内 部 组 成 就 是 如 下 三 个 实例 变量 : 








transient int size = 0; 
transient Node<E> first; 
transient Node<E> last; 








我 们 暂时 忽略 transient 关 键 字 ，size 表 示 链 表 长 度 ， 默 认为 0，first 指 
回头 节点 ，last 指 同 尾 节点 ， 初 始 值 都 为 null。 


LinkedList 的 所 有 public 方 法 内 部 操作 的 都 是 这 三 个 实例 变量 ， 有 具体 





是 怎么 操作 的 ?链接 关系 是 如 何 维护 的 ? 我 们 看 一 些 主要 的 方法 ， 先 来 
看 add 方 法 。 


2.add 方 法 
add 方 法 的 代码 为 : 





public boolean add(E e) { 
linkLast(e); 
return true; 


} 





主要 就 是 调用 了 linkLast， 它 的 代码 为 : 





void linkLast(E e) { 
final Node<E> 1 = last; 
final Node<E> newNode = new Node<>(1, e, null); 
last = newNode; 
if(1 == null) 
first = newNode,; 
else 
l1.next = newNode; 
SIZe++， 
modCount++; 





代码 的 基本 步骤 如 下 。 


1) 创建 一 个 新 的 节点 newNode。1 和 1]ast 指 向 原来 的 尾 节 点 ， 如 果 原 
来 链表 为 空 ， 则 为 null。 代 码 为 : 








Node<E> newNode = new Node<>(1, e, null); 





2) 修改 尾 节点 last， 指 问 新 的 最 后 节点 newNode。 代 码 为 : 





lJast = newNode; 








3) 修改 前 节操 的 后 向 链 接 ， 如 末 原 来 链表 为 空 ， 则 让 关节 点 指 疝 
新 和 节点， 否则 让 前 一 个 节点 的 next 指 癌 新 和 节点。 代码 为 : 





if(1 == null) 

first = newNode; 
else 

1.next = newNode; 





4) 增加 链表 大 小 。 代 码 为 : 





Sizet++ 





modCount++ 的 目的 与 ArrayList 是 一 样 的 ， 记 录 修 改 次 数 ， 便 于 迭 
代 中 间 检 测 结构 性 变化 。 


我 们 通过 一 些 图 示 来 进行 介绍 。 比 如 ， 代 码 为 : 





List<String> list = new LinkedList<String>(); 
list.add("a"); 
list.add("b"); 





执行 完 第 一 行 后 ， 内 部 结构 如 图 9-1 所 示 。 


添加 完 “a”* 后 ， 内 部 结构 如 图 9-2 所 示 。 
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图 9-2 ”LinkedList 对 象 内 部 结构 : 添加 一 个 元 素 后 


添加 完 “<b* 后 ， 内 部 结构 如 图 9-3 所 示 。 
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图 9-3 ”LinkedList 对 象 内 部 结构 : 添加 两 个 元 素 后 
可 以 看 出 ， 与 ArrayList 不 同 ，Linked-List 的 内 存 是 按 需 分 配 的 ， 不 
需要 预先 分 配 多 余 的 内 存 ， 添 加 元 素 只 需 分 配 新 元 素 的 空间 ， 然 后 调节 
几 个 链接 即 可 。 
3. 根 据 索 引 访问 元 素 get 


应 加 了 元 素 ， 如 何 根据 索引 访问 元 素 呢 ? 我 们 看 下 get 方 法 的 代 




















但: 





public E get(int index) { 
checkElementIndex(index); 
return node(index).item; 


} 





checkElementIndex 检 查 索 引 位 置 的 有 效 性 ， 如 果 无 效 ， 则 抛 出 异 
和 第， 代码 为 : 





private void checkElementIndex(int index) { 
if(!isElementIindex(index)) 
throw new IndexOutOofBoundsException(outOofBoundsMsg(index)); 


private boolean isElementIndex(int index) { 
return index >= 0 && index < size; 








如 果 index 有 效 ， 则 调用 node 方 法 查找 对 应 的 节点 ， 其 item 属 性 就 指 
向 实际 元 素 内 容 ，node 方 法 的 代码 为 : 





Node<E> node(int index) { 
if(index < (size >> 1)) { 


Node<E> x = first,; 
for(int i = 0; i < index; i++) 
x = x.next; 
return x; 
} else { 
Node<E> x = last; 
for(int i = size - 1; i > index; i--) 
x = x.prev; 
return x; 
} 
} 








size>>1 等 于 size/2， 如 果 索 引 位 置 在 前 半 部 分 
(index< (size>>1) ) ， 则 从 头 节 点 开始 查找 ， 人 否则 ， 从 尾 节 点 开始 得 
找 。 可 以 看 出 ， 与 ArrayList 明 显 不 同 ，ArrayList 中 数组 元 素 连 续 存 放 ， 
可 以 根据 索引 直接 定位 ， 而 在 LinkedList 中 ， 则 必须 从 头 或 尾 顺 着 链接 
查找 ， 效 率 比 较 低 。 


4. 根 据 内 容 查 找 元 素 
我 们 看 下 indexOf 的 代码 : 








public int indexOof(Object o) { 
int index = 0，; 
If(o == null) { 
for(Node<E> x = first; x != null; x = x.next) { 
if(x.item == null) 
return index; 
index++; 


} 
} else { 
for(Node<E> x = first; x != null; x = x.next) { 
if(o.equals(x.item)) 
return index; 
index++; 


return -1; 





代码 也 很 简单 ， 从 头 节点 顺 着 链接 往 后 找 ， 如 果 要 找 的 是 null， 则 
找 第 一 个 item 为 null 的 节点 ， 人 否则 使 用 equals 方 法 进行 比较 。 


5. 插 入 元 素 


add 是 在 尾部 添加 元 素 ， 如 果 在 头 部 或 中 间 插 入 元 素 昵 ? 可 以 使 用 
如 下 方法 : 








public void add(int index，E element) 





它 的 代码 是 : 





public void add(int index, E element) { 
checkPositionIndex(index); 
if(index == size) 
linkLast(element); 
else 
linkBefore(element, node(index)); 





如 果 index 为 size， 添 加 到 最 后 面 ， 一 般 情 况 ， 是 插入 到 index 对 应 节 
点 的 前 面 ， 调 用 方法 为 linkBefore， 它 的 代码 为 : 





void linkBefore(E e, Node<E> succ) { 
final Node<E> pred = succ.prev; 
final Node<E> newNode = new Node<>(pred, e, succ); 
succ.prev = newNode; 
if(pred == null) 
first = newNode; 
else 
pred,next = newNode; 
Sizet+t+; 
modCount++; 








参数 succ 表 示 后 继 节点 ， 变 量 pred 表 示 前 驱 节 点 ， 目 标 是 在 pred 和 
succ 中 间 插 入 一 个 节点 。 插 入 步骤 是 : 


1) 新 建 一 个 节点 newNode， 前 驱 为 pred， 后 继 为 succ。 代 码 为 : 





Node<E> newNode = new Node<>(pred, e, succ); 





2) 让 后 继 的 前 驱 指 网 新 节点 。 代 码 为 : 





succ.prev = newNode; 





3) 让 前 驱 的 后 继 指 癌 新 市 皮 ， 如 果 前 驱 为 宇 ， 那 么 修改 头 市 点 指 
向 新 节点 。 人 代码 为 : 





if (pred == null) 

first = newNode 
else 

pred,next = newNode; 





4) 增加 长 度 。 
我 们 通过 图 示 来 进行 介绍 。 还 是 上 面 的 例子 ， 比 如 ， 添 加 一 个 元 


人 ~、 





list.add(1, "c"); 





内 存 结构 如 图 9-4 所 示 。 





图 9-4 ”LinkedList 对 象 内 部 结构 :在 中 间 插 入 元 素 后 





可 以 看 出 ， 在 中 间 插 入 元 素 ，LinkedList 只 需 按 需 分 配 内 存 ， 修 改 
前 驱 和 后 继 节 点 的 链接 ， 而 ArrayList 则 可 能 需要 分 配 很 多 额外 空间 ， 且 
移动 所 有 后 续 元 素 。 
6. 删 除 元 素 


我 们 再 来 看 删除 元 系 ， 代 码 为 : 








public E remove(int index) { 
checkElementIndex(index); 
return unlink(node(index)); 


} 





通过 node 方 法 找到 节点 后 ， 调 用 了 unlink 方 法 ， 代 码 为 : 





E unlink(Node<E> x) { 

final E element = x.item; 
final Node<E> next = x.next; 
final Node<E> prev = x.prev; 
if(prev == null) { 

first = next; 
} else { 

prev.next = next; 

x.prev = null; 


} 

if(next == null) { 
last = prev; 

} else { 
next.prev = prev; 
x.next = null; 


} 

x.item = null; 
Size--; 
modCount++; 


return element 








删除 x 节点 ， 基 本 思路 就 是 让 x 的 前 驱 和 后 继 直 接 链 接 起 来 ，next 古 
x 的 后 继 ，prev 是 x 的 前 驱 ， 具 体 分 为 两 步 。 


1) 让 x 的 前 驱 的 后 继 指 向 x 的 后 继 。 如 果 x 没 有 前 驱 ， 说 明 删 除 的 是 
头 节 点 ， 则 修改 尖 市 点 指 问 x 的 后 继 。 


2) 让 x 的 后 继 的 前 驱 指 向 x 的 前 驱 。 如 果 x 没 有 后 继 ， 说 明 删 除 的 古 
尾 节 点 ， 则 修改 尾 贡 点 指 网 x 的 前 驱 。 


通过 图 示 进 行 说 明 。 还 是 上 面 的 例子 ， 如 果 删 除 一 个 元 素 : 








list.remove(1); 





内 存 结构 如 图 9-5 所 示 。 
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图 9-5 ”LinkedList 对 象 内 部 结构 : 删除 元 素 后 


以 上 ， 我 们 介绍 了 LinkedList 的 内 部 组 成 ， 以 及 几 个 主要 方法 的 实 
现代 码 ， 其 他 方法 的 原理 也 者 类似， 我 们 束 不 资 述 了 。 


前 面 我 们 提 到 ， 对 于 队列 、 栈 和 双 端 队列 接口 ， 长 度 可 能 有 限制 ， 
LinkedList 实 现 了 这 些 接口 ， 不 过 LinkedList 对 长 度 并 没有 限制 。 





9.2.3 LinkedList 特 点 分 析 


用 法 上 ，LinkedList 是 一 个 List， 但 也 实现 了 Deque 接 口 ， 可 以 作为 
队列 、 栈 和 双 端 队列 使 用 。 实 现 原理 上 ，LinkedList 内 部 是 一 个 双向 链 
表 ， 并 维护 了 长 度 、 头 节点 和 尾 节 点 ， 这 决定 了 它 有 如 下 特点 。 


1) 按 需 分 配 空间 ， 不 需要 预先 分 配 很 多 空间 。 


2) 不 可 以 随机 访问 ， 按 照 索引 位 置 访问 效率 比较 低 ， 必 须 从 头 或 
尾 顺 着 链接 找 ， 效 率 为 O (N/2) 。 


3) 不 管 列表 是 否 已 排序 ， 只 要 是 按照 内 容 查 找 元 素 ， 效 率 都 比较 
低 ， 必 须 逐 个 比较 ， 效 率 为 0 CN) 。 

4) 在 两 端 添加 、 删 除 元 素 的 效率 很 遍 ， 为 O (1) 。 

5) 在 中 间 插 入 、 删 除 元 素 ， 要 移 定 位， 效率 比较 低 ， 为 O CN) ， 
但 修改 本 里 的 效率 很 高 ， 效 率 为 O (1) 。 


理解 了 LinkedList 和 ArrayList 的 特点 ， 束 能 比较 容易 地 进行 选择 
了 ， 如 有 果 列 表 长 度 未 知 ， 添 加 、 删 除 操作 比较 多 ， 尤 其 经 音 从 两 端 进 行 
操作 ， 而 按照 索引 位 置 访问 相对 比较 少 ， 则 LinkedList 是 比较 理想 的 选 
择 。 











9.3 ” 谢 析 ArrayDeque 


LinkedList 实 现 了 队列 接口 Queue 和 双 端 队列 接口 Deque，Java 容 髓 
类 中 还 有 一 个 双 端 队列 的 实现 类 ArrayDeque， 它 是 基于 数组 实现 的 。 我 
们 知道 ， 一 般 而 言 ， 由 于 需要 移动 元 素 ， 数 组 的 插入 和 删除 效率 比较 
它 是 怎么 实现 的 呢 ? 本 节 就 来 详细 
条 讨 。 











ArrayDeque 有 如 下 构造 方法 : 





public ArrayDeque() 
public ArrayDeque(int numElements) 
public ArrayDeque(Collection<? extends E> c) 





numElements 表 示 元 素 个 数 ， 初 始 分 配 的 空间 会 至 少 容纳 这 么 多 元 
素 ， 但 空间 不 是 正好 numElements 这 么 大 ， 竺 会 我 们 会 介绍 其 实现 细 








开 


ArrayDeque 实 现 了 Deque 接 口 ， 同 LinkedList 一 样 ， 它 的 队列 长 度 也 
是 没有 限制 的 ，Deque 扩 展 了 Queue， 有 队列 的 所 有 方法 ， 还 可 以 看 作 
栈 ， 有 栈 的 基本 方法 push/pop/peek， 还 有 明确 的 操作 两 端的 方法 如 
addFirsVyremoveLast 等 ， 有 具体 用 法 与 LinkedList 一 节 介 绍 的 类 似 ， 就 不 葵 
述 了 ， 下 面 看 其 实现 原理 〈 基 于 Java7) 。 


9.3.1 ”实现 原理 


ArrayDeque 内 部 主要 有 如 下 实例 变量 : 





private transient E[] elements 
private transient int head; 
private transient int tail; 








elements 就 是 存储 元 素 的 数组 。ArrayDeque 的 高 效 来 源 于 head 和 tail 
这 两 个 变量 ， 它 们 使 得 物理 上 简单 的 从 头 到 尾 的 数组 变 为 了 一 个 逻辑 上 
循环 的 数组 ， 避 免 了 在 头 尾 操作 时 的 移动 。 我 们 来 解释 下 循环 数组 的 概 
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1. 循 环 数组 


对 于 一 般 数 组 ， 比 如 arr， 第 一 个 元 素 为 arr[0]， 最 后 一 个 为 
arr[arr.length-1]。 但 对 于 ArrayDeque 中 的 数组 ， 它 是 一 个 逻辑 上 的 循环 
数组 ， 所 谓 循环 是 指 元 素 到 数组 尾 之 后 可 以 接着 从 数组 头 开 始 ， 数 组 的 
第 一 个 和 最 后 一 个 元 素 都 与 head 和 tail 这 两 个 变量 有 关 ， 有 具体 来 
Wo: 


1) 如 果 head 和 tail 相 同 ， 则 数组 为 空 ， 长 度 为 0。 


2) 如 果 tail 大 于 head， 则 第 一 个 元 素 为 elements[head]， 最 后 一 个 为 
elements[tail-1]， 长 度 为 tail-head， 元 素 索 引 从 head 到 tail-1 。 








3) 如 果 tail 小 于 head， 且 为 0， 则 第 一 个 元 素 为 elements[head]， 最 
后 一 个 为 elements[elements.length-1]， 元 素 索 引 从 head 到 elements.length- 
1 。 


4) 如 果 tail 小 于 head， 且 大 于 0， 则 会 形成 循环 ， 第 一 个 元 素 为 
elements[head]， 最 后 一 个 是 ealementsftail-1]， 元 素 索 引 从 head 到 
elements.length-1， 然 后 再 从 0 到 tail-1。 


我 们 来 看 一 些 图 示 。 第 一 种 情况 ， 数 组 为 裕 ，head 和 tail 相 同 ， 如 图 
9-6 所 示 。 


第 二 种 情况 ，tail 大 于 head， 如 图 9-7 所 示 ， 都 包含 三 个 元 素 。 











图 9-6 ”循环 数组 : head 和 tail 相 同 


1 1 1 1 1 1 1 





图 9-7 ”循环 数组 : tail 大 于 head 
第 三 种 情况 ，tail 为 0， 如 图 9-8 所 示 。 


第 四 种 情况 ，tail 不 为 0， 且 小 于 head， 如 图 9-9 所 示 。 
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图 9-8 循环 数组 : tail 为 0 
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图 9-9 ”循环 数组 ，tail 不 为 0 日 小 于 head 


理解 了 循环 数组 的 概念 ， 我 们 来 看 ArrayDeque 一 些 主要 操作 的 代 
人 码 ， 先 来 看 构造 方法 





2. 构 造 方法 
默认 构造 方法 的 代码 为 : 





public ArrayDeque() { 
elements = (E[]) new Object[16]; 
} 





分 配 了 一 个 长 度 为 16 的 数组 。 如 果 有 参数 numElements， 代 码 为 : 





public ArrayDeque(int numElements) { 
allocateElements(numElements); 
} 





不 是 简单 地 分 配给 定 的 长 度 ， 而 是 调用 了 allocateElements。 这 个 方 
法 的 代码 看 上 去 比较 复杂 ， 我 们 就 不 列举 了 ， 它 主要 就 是 在 计算 应 该 分 
配 的 数组 的 长 度 ， 计 算 逻 辑 如 下 : 


1) 如 果 numElements 小 于 8， 就 是 8。 


2) 在 numElements 大 于 等 于 8 的 情况 下 ， 分 配 的 实际 长 度 是 严格 大 
于 numElements 并 且 为 2 的 整数 次 盐 的 最 小 数 。 比 如 ， 如 果 numElements 
为 10， 则 实际 分 配 16， 如 果 num-Elements 为 32， 则 为 64。 


为 什么 要 为 2 的 寡 次 数 呢 ? 我 们 待 会 会 看 到 ， 这 样 会 使 得 很 多 操作 
的 效率 很 高 。 为 什么 要 严格 大 于 numElements 呢 ? 因为 循环 数组 必须 时 
刻 至 少 留 一 个 空位 ，tail 变 量 指 癌 下 一 个 空位 ， 为 了 容纳 numElements 个 
元 素 ， 至 少 需要 numElements+1 个 位 置 。 


看 最 后 一 个 构造 方法 : 














public ArrayDeque(Collection<? extends E> c) { 
allocateElements(c.size( )); 
addAll(c); 





同样 调用 allocateElements 分 配 数组 ， 随 后 调用 了 addAll， 而 addAll 
只 是 循环 调用 了 add 方 法 。 下 面 我 们 来 看 add 的 实现 。 


3. 从 尾部 添加 
add 方 法 的 代码 为 : 





public boolean add(E e) { 
addLast (e); 
return true; 


} 





addLast 的 代码 为 : 





public void addLast(E e) { 
if(e == null) 
throw new NullPointerException(); 
elements[tail] = e; 
if( (tail = (tail + 1) & (elements, length - 1)) == head) 
doubleCapacity( ); 





将 元 素 添 加 到 tail 处 ， 然 后 tail 指 疝 下 一 个 位 置 ， 如 果 队 列 满 了 ， 则 
调用 doubleCapa-city 扩 展 数 组 。tail 的 下 一 个 位 置 是 (tail+1) 
& (elements.length-1) ， 如 果 与 head 相 同 ， 则 队列 就 满 了 。 


进行 与 操作 保证 了 索引 在 正确 范围 ， 与 〈elements.length-1) 相 与 束 
可 以 得 到 下 一 个 正确 位 置 ， 是 因为 elements.length 是 2 的 祖 次 方 ， 
Celements.length-1) 的 后 几 位 全 是 1， 无 论 是 正 数 还 是 负数 ， 与 
Celements.length-1) 相 与 都 能 得 到 期 望 的 下 一 个 正确 位 置 。 


比如 ， 如 果 elements.length 为 8， 则 (elements.length-1) 为 7， 二 进 
制 表 示 为 0111， 对 于 负数 -1， 与 7 相 与 ， 结 果 为 7， 对 于 正 数 8， 与 7 相 
与 ， 结 果 为 0， 都 能 达到 循环 数组 中 找 下 一 个 正确 位 置 的 目的 。 这 种 位 
ee 效率 也 很 高 ， 后 续 代 码 中 还 会 看 
| 。 


doubleCapacity 将 数组 扩大 为 两 倍 ， 代 码 为 : 














private void doubleCapacity() { 
assert head == tail; 
int p = head; 
int n = elements.1length; 
int r = n - p; //number of elements to the right of p 


int newCapacity = n << 1; 
if(newCapacity < 0) 

throw new IllegalSstateException("Sorry, deque too big"); 
Object[] a = new Object[newCapacity]; 
System.arraycopy(elements, p, a, 0, r); 
System.arraycopy(elements, 0, a, r, p); 
elements = (E[])a; 
head = 0; 
tail] = n; 





分 配 一 个 长 度 翻 倍 的 新 数组 a， 将 head 右 边 的 元 素 复制 到 新 数组 开 
头 处 ， 再 复制 左边 的 元 素 到 新 数组 中 ， 最 后 重新 设置 head 和 tail，head 设 
为 0，tail 设 为 n。 


我 们 来 看 一 个 例子 ， 假 设 原 长 度 为 8，head 和 tail 为 4， 现 在 开始 扩大 
数组 ， 扩 大 前 后 的 结构 如 图 9-10 所 示 。 








图 9-10 ”循环 数组 : 扩容 前 后 对 比 
add 是 在 未 尾 添 加 ， 我 们 再 看 在 头 部 添加 的 代码 。 
4. 从 头 部 添加 
addFirst〈) 方法 的 代码 为 : 





public void addFirst(E e) { 
if(e == null) 
throw new NullPointerException(); 
elements[head = (head - 1) & (elements.length - 1)] = e; 
if(head == tail) 
doubleCapacity( ); 
} 
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在 头 部 深 加 ， 要 先 让 head 指 同 前 一 个 位 置 ， 然 后 再 赋值 给 head 押 在 
位 置 。head 的 前 一 个 位 置 是 (head-1)〉& (elements.length-1) 。 刚 开始 
head 为 0， 如 果 elements.length 为 8， 则 (head-1) & (elements.length-1) 
的 结果 为 7。 比 如 ， 执 行 如 下 代码 : 





Deque<String> queue = new ArrayDeque<>(7); 
queue.addFirst("a"); 
queue.addFirst("b"); 





执行 完 后 ， 内 部 结构 如 图 9-11 所 示 。 


| WE 之 .oe 


图 9-11 循环 数组 : 从 头 部 添加 后 
完了 添加 ， 下 面 来 看 删除 。 
5. 从 头 部 删除 
removeFirst 方 法 的 代码 为 : 





外 


| 





public E removeFirst() { 
E x = pollFirst(); 
if(x == null) 
throw new NoSuchElementException(); 
return x; 


} 





主要 调用 了 pollFirst 方 法 ，pollFirst 方 法 的 代码 为 : 





public E pollFirst() { 
int h = head; 
E result = elements[h]; //Element is null if deque empty 
if(result == null) 
return null,; 


elements[h] = null; //Must null out slot 
head = (h + 1) & (elements,Jength - 1); 
return result,; 





代码 比较 简单 ， 将 原 头 部 位 置 置 为 null， 然 后 head 置 为 下 一 个 位 
置 ， 下 一 个 位 置 为 (h+1) & (elements.length-1) 。 从 尾部 删除 的 代码 
是 类 似 的 ， 就 不 壮 述 了 。 

6. 查 看 长 度 


ArrayDeque 没 有 单独 的 字段 维护 长 度 ， 其 size 方 法 的 代码 为 : 





public int size() { 
return (tail - head) & (elements.length - 1); 
} 





通过 该 方法 即 可 计算 出 size。 
7. 检 查 给 定 元 素 是 否 存 在 
contains 方 法 的 代码 为 : 








public boolean contains(Object o) { 
If(o == null) 
return false; 
int mask = elements, Jength - 1; 
int i = head; 
E x; 
while( (x = elements[i]) != null) { 
if(o.equals(x)) 
return true; 
i= (i + 1) & mask,; 


return false,; 





就 是 从 head 开 始 遍 历 并 进行 对 比 ， 循 环 过 程 中 没有 使 用 tail， 而 是 到 
元 素 为 null 就 结束 了 ， 这 是 因为 在 ArrayDeque 中 ， 有 人 效 元 素 不 允许 为 


null。 


8.toArray 方 法 


toArray 方 法 的 代码 为 : 





public Object[] toArray() { 
return copyElements(new Object[size()|]); 
} 





copyElements 的 代码 为 : 





private <T> T[] copyElements(T[] a) { 
if(head < tail) { 
System.arraycopy(elements, head, a, 0, size()); 
} else if(head > tail) { 
int headPortionLen = elements.length - head; 
System.arraycopy(elements, head, a, 0, headPortionLen); 
System.arraycopy(elements, 0, a, headPortionLen, tail); 


return a; 





如 果 head 小 于 tail， 束 是 从 head 开 始 复制 size 个 ， 否 则 ， 复 制 丈 辑 与 
doubleCapacity 方 法 中 的 类 似 ， 先 复制 从 head 到 末尾 的 部 分 ， 然 后 复制 从 
0 到 tail 的 部 分 。 


9. 原 理 小 结 
以 上 就 是 ArrayDeque 的 基本 原理 ， 内 部 它 是 一 个 动态 扩展 的 循环 数 


组 ， 通 过 head 和 tail 变 量 维护 数组 的 开始 和 结尾 ， 数 组 长 度 为 2 的 祖 次 
方 ， 使 用 高 效 的 位 操作 进行 各 种 判断 ， 以 及 对 head 和 tail 进 行 维护 。 


9.3.2 ArrayDeque 特 点 分 析 

ArrayDeque 实 现 了 双 端 队列 ， 内 部 使 用 循环 数组 实现 ， 这 决定 了 它 
有 如 下 特点 。 

1) 在 两 端 添加 、 删 除 元 素 的 效率 很 高 ， 动 态 扩展 需要 的 内 存 分 配 
以 及 数组 复制 开销 可 以 被 平 推 ， 有 具体 来 说 ， 添 加 N 个 元 素 的 效率 为 
O CN) 。 

2) 根据 元 素 内 容 查 找 和 删除 的 效率 比较 低 ， 为 O(N) 。 








3) 与 ArrayList 和 LinkedList 不 同 ， 没 有 索引 位 置 的 概念 ， 不 能 根据 
索引 位 置 进行 操作 。 


ArrayDeque 和 LinkedList 都 实现 了 Deque 接 口 ， 应 该 用 哪 一 个 昵 ? 如 
果 只 需要 Deque 接 口 ， 从 两 端 进行 操作 ， 一 般 而 言 ，ArrayDeque 效 率 更 
高 一 些 ， 应 该 被 优先 使 用 ， 如 果 同 时 需要 根据 索引 位 置 进行 操作 ， 或 者 
经 常 需要 在 中 间 进 行 插入 和 删除 ， 则 应 该 选 LinkedList。 


至 些 ， 关 于 列表 和 队列 的 内 容 束 介绍 完了 ， 无 论 是 ArrayList、 
LinkedList 还 是 Array-Deque， 按 内 容 碍 找 元 素 的 效率 都 很 低 ， 都 需要 逐 
个 进行 比较 ， 有 没有 更 有 效 的 方式 呢 ? 让 我 们 下 一 章 来 看 各 种 Map 和 
9et。 
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第 10 章 ”Map 和 Set 


上 一 章 介 绍 了 ArrayList、LinkedList 和 ArrayDeque， 它 们 的 一 个 共 
同 特点 是 : 但 找 元 素 的 效率 都 比较 低 ， 都 需要 逐个 进行 比较 ， 本 章 介 绍 
各 种 Map 和 Set， 它 们 的 查找 效率 要 高 得 多 。Map 和 Set 都 是 接口 ，Java 中 
有 多 个 实现 类 ， 主 要 包括 HashMap、HashSet、TreeMap、TreeSet、 
LinkedHashMap、LinedHashSet、EnumMap、EnumSet 等 ， 它 们 都 有 什 
么 用 ? 有 什么 不 同 ? 是 如 何 实现 的 ? 本 章 进 行 深入 剖析 ， 我 们 先 从 最 常 
用 的 HashMap 开 始 。 











10.1 襄 析 HashMap 


字面 上 看 ，HashMap 由 Hash 和 Map 两 个 单词 组 成 ， 这 里 Map 不 是 地 
图 的 意思 ， 而 是 表示 映射 天 系 ， 是 一 个 接口 ， 实 现 Map 接 口 有 多 种 方 
2 HashMap 实 现 的 方式 利用 了 哈 希 (Hash) 。 下 面 先 来 看 Map 接 口 ， 
和 看 HashMap 的 用 法 ， 然 后 看 实现 原理 ， 最 后 总 结 分 析 HashMap 的 特 


10.1.1 Map 接口 


Map 有 键 和 值 的 概念 。 一 个 键 映射 到 一 个 值 ，Map 按 照 键 存储 和 访 
问 值 ， 刍 不 能 重复 ， 即 一 个 键 只 会 存储 一 份 ， 给 同一 个 键 重复 设 值 会 . 
和 使 用 Map 可 以 方便 地 处 理 需要 根据 键 访 问 对 象 的 场景 ， 
0D: 





-一 个 词典 应 用 ， 键 可 以 为 单词 ， 值 可 以 为 单词 信息 类 ， 包 括 合 
义 、 发 音 、 例 句 等 ; 


-统计 和 记录 一 本 书 中 所 有 单词 出 现 的 次 数 ， 可 以 以 单词 为 键 ， 以 
出 现 次 数 为 值 ; 


管理 配置 文件 中 的 配置 项 ， 配 置 项 是 典型 的 键 值 对 ; 
根据 身份 证 号 得 询 人 员 信 息 ， 号 份 证 号 为 键 ， 人 员 信 息 为 值 。 


数组 、ArrayList、LinkedList 可 以 视 为 一 种 特殊 的 Map， 键 为 索引 ， 
值 为 对 象 。 


Java 7 中 Map 接 口 的 定义 如 代码 清单 10-1 所 示 ， 用 注释 表示 方法 的 含 
义 。 


代码 清单 10-1 Map 接 口 














public interface Map<K,V> { //K 和 V 是 类 型 参数 ， 分 别 表示 键 (Key ) 和 值 (Value ) 的 类 型 
V put(K key，V value); // 保 存 键 值 对 ， 人 key， 禾 盖 ， 返 回 原来 的 值 
V get(0bject key); // 根 据 键 获取 值 ， 没 找到 ， 返 回 null 












































V _ remove(0bject key); // 根 据 键 删除 键 值 对 ， 返 回 key 原 来 的 值 ， 如 果 不 存在 ， 返 回 nu11 
int size(); // 查 看 Map 中 键 值 对 的 个 数 
boolean isEmpty(); // 是 否 为 空 
boolean containsKey(0bject key); // 碍 看 是 否 包含 某 个 键 
boolean containsValue(0bject value); // 查 看 是 否 包 含 某 个 值 
void putAll(Map<? extends K，? extends V> m);// 保 存 m 中 的 所 有 键 值 对 到 当前 Map 
void clear(); // 清 空 Map 中 所 有 键 值 对 
Set<K> keySet(); // 获 取 Map 中 键 的 集合 
Collection<V> values(); // 获 取 Map 中 所 有 值 的 集合 
Set<Map .Entry<K，V>> entrySet(); // 获 取 Map 中 的 所 有 键 值 对 
interface Entry<K,V> { // 骨 套 接口 ， 表 示 一 条 键 值 对 
K getKkey() ; // 键 值 对 的 键 
V getValue( ) ， // 键 值 对 的 值 
V SetVvalue(V value); 
boolean edquals(Object 0)， 
int hashCode( ); 





















































































































































boolean equals(Object 0)， 
int hashcode( ); 


boolean containsValue(Object value); 
Set<K> keySet(); 





Java 8 增加 了 一 些 默 认 方 法 ， 如 getOrDefault、forEach、replaceAll、 
putIfAbsent、replace、computelfAbsent、merge 等 ，Java 9 增加 了 多 个 重 
载 的 of 方法 ， 可 以 方便 地 根据 一 个 或 多 个 键 值 对 构建 不 变 的 Map， 具 体 
可 参见 API 文 档 ， 我 们 就 不 介绍 了 。 


Set 是 一 个 接口 ， 表 示 的 是 数学 中 的 集合 概念 ， 即 没有 重复 的 元 素 
集合 。Java 7 中 的 Set 定 义 为 : 














public interface Set<E> extends Collection<E> { 





它 扩 展 了 Collection， 但 没有 定义 任何 新 的 方法 ， 不 过 ， 它 要 求 所 有 
实现 者 都 必须 确保 Set 的 语义 约束 ， 即 不 能 有 重复 元 素 。Java 9 增加 了 多 
个 重 载 的 of 方法 ， 可 以 根据 一 个 或 多 个 元 素 生成 不 变 的 Set， 具 体 可 参见 
API 文 档 。 关 于 Set，10.2 节 我 们 再 详细 介绍 


Map 中 的 键 是 没有 重复 的 ， 所 以 ketSet () 返回 了 一 个 Set。 
keySet () 、values () 、 0 () 有 一 个 共同 的 特点 ， 它 们 返回 的 
ee 不 是 复制 的 值 ， 基 于 返回 值 的 修改 会 直接 修改 Map 目 身 ， 比 
中 : 











map ,keySet().clear()， 





会 删除 所 有 键 值 对 。 
10.1.2 HashMap 


HashMap 实 现 了 Map 接 口 ， 我 们 通过 一 个 简单 的 例子 来 看 如 何 使 
用 。 在 7.6 节 ， 我 们 介绍 过 如 何 产生 随机 数 ， 现 在 ， 我 们 写 一 个 程序 ， 
来 看 随机 产生 的 数 是 否 均匀 。 比 如 ， 随 机 产生 1000 个 0 一 3 的 数 ， 统 计 每 
个 数 的 次 数 ， 如 代码 清单 10-2 所 示 。 


代码 清单 10-2 ”使 用 HashMap 统 计 随 机 数 





Random rnd = new Random(); 
Map<Integer, Integer> countMap = new HashMap<>(); 
for(int i=0; i<1000; i++){ 
int num = rnd.nextInt(4); 
Integer count = countMap.get(num); 
if(count==null1)t{ 
countMap.put(num, 1); 
}elsef{ 
countMap.put(num, count+1); 


} 


for(Map.Entry<Integer, Integer> kv : countMap.entrySet())t{ 
System.out.printin(kv.getkey()+","+kv.getValue()); 








} 
一 次 运行 的 输出 为 : 
0,269 
1, 236 
2, 261 
3, 234 





次 数 分 别 是 269、236、261、234， 代 码 比 较 简 单 ， 就 不 解释 了 。 除 
了 默认 构造 方法 ，HashMap 还 有 如 下 构造 方法 : 





public HashMap(int initialCapacity) 
public HashMap(int initialCapacity, float loadFactor) 
public HashMap(Map<? extends kK, ? extends V> m) 





最 后 一 个 以 一 个 已 有 的 Map 构 造 ， 复 制 其 中 的 所 有 刍 值 对 到 当前 
Map。 前 前 两 个 涉及 参数 initialCapacity 和 loadFactor， 它们 是 什么 意思 呢 ? 
我 们 需要 看 下 HashMap 的 实现 原理 。 


10.1.3 ”实现 原理 


我 们 先 来 看 HashMap 的 内 部 组 成 ， 然 后 分 析 一 些 主要 方法 的 实现 ， 
代码 基于 Java 7。 


1. 内 部 组 成 
HashMap 内 部 有 如 下 几 个 主要 的 实例 变量 : 





transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE; 
transient int size; 

int threshold; 

final float loadFactor; 





size 表 示 实 际 键 值 对 的 个 数 。table 是 一 个 Entry 类 型 的 数组 ， 称 为 哈 
希 表 或 哈 硕 桶 ， 其 中 的 每 个 元 素 指 同一 个 单 癌 链 表 ， 链 表 中 的 每 个 节点 
Entry 是 一 个 内 部 类 ， 它 的 实例 变量 和 构造 方法 代码 
DF 下: 








static class Entry<K,V> implements Map.Entry<K,V> { 
final K key; 
V value; 
Entry<K,V> next,; 
int hash,; 
Entry(int h, K k, V v, Entry<K,V> n) { 
value = v; 
next = n; 
key = k; 
hash = h; 
} 
} 





其 中 ，key 和 value 分 别 表 示 键 和 值 ，next 指 向 下 一 个 Entry 节 点 ， 
hash 是 key 的 hash 值 ， 待 会 我 们 会 介绍 其 计算 方法 。 直接 存储 hash 值 是 为 
了 在 比较 的 时 候 加 快 计 算 ， 待 会 我 们 看 代码 。 


table 的 初始 值 为 EMPTY _TABLE， 是 一 个 空 表 ， 有 具体 定义 为 : 











static final Entry<?,?>[] EMPTY_TABLE = {}; 








当 添 加 键 值 对 后 ，table 就 不 是 空 表 了 ， 它 会 随 着 键 值 对 的 添加 进行 
扩展 ， 扩 展 的 策略 类 似 于 ArrayList。 添 加 第 一 个 元 素 时 ， 默 认 分 配 的 大 
小 为 16， 不 过 ， 并 不 是 size 大 于 16 时 再 进行 扩展 ， 下 次 什么 时 候 扩 展 与 
threshold 有 关 。 


threshold 表 示 冰 值 ， 当 键 值 对 个 数 size 大 于 等 于 threshold 时 考虑 进行 
扩展 。threshold 是 怎么 算出 来 的 呢 ? 一 般 而 言 ，threshold 等 于 table.length 
乘 以 loadFactor。 比 如 ， 如 果 table.length 为 16，loadFactor 为 0.75， 则 
threshold 为 12。loadFactor 是 负载 因子 ， 表 示 整 体 上 table 被 占用 的 程度 ， 
是 一 个 浮 点 数 ， 默 认为 0.75， 可 以 通过 构造 方法 进行 修改 。 


下 面 ， 我 们 通过 一 些 主要 方法 的 代码 来 介绍 HashMap 古 如 何 利用 这 
些 内 部 数据 实现 Map 接 口 的 。 先 看 默认 构造 方法 。 需 要 说 明 的 是 ， 为 清 
晰 和 简单 起 见 ， 我 们 可 能 会 省 略 一 些 非 主要 代码 。 
2. 默 认 构 造 方法 


默认 构造 方法 的 代码 为 : 











public HashMap() { 
this(DEFAULT_INITIAL CAPACITY, DEFAULT_LOAD_FACTOR); 





DEFAULT INITIAL CAPACITY 为 16， 
DEFAULT LOAD FACTOR 为 0.75， 默 认 构造 方法 调用 的 构造 方法 主要 
代码 为 : 





public HashMap(int initialCapacity, float loadFactor) { 
this.loadFactor = loadFactor; 
threshold = initialCapacity; 

} 





主要 就 是 设置 1oadFactor 和 threshold 的 初始 值 。 
3. 保 存 键 值 对 


下 面 ， 我 们 来 看 HashMap 是 如 何 把 一 个 键 值 对 保存 起 来 的 ， 代 码 


站 
AN 





public V put(K key, V value) { 
if(table == EMPTY_TABLE) { 
inflateTable(threshold); 


} 
if(key == null) 
return putForNullkey(value); 
int hash = hash(key); 
int i = indexFor(hash, table.length); 
for(Entry<K,V> e = table[il]; e != null; e = e.next) { 
Object k; 
if(e.hash == hash && ((k = e.key) == key || key.equals(k))) { 
V oldValue = e.value; 
e.value = value; 
e,recordAccess(this ) ， 
return oldValue; 


modCount++; 
addEntry(hash, key, value, 1i); 
return null; 





如 果 是 第 一 次 保存 ， 首 先 调 用 inflateTable () 方法 给 table 分 配 实 际 
的 空间 ，inflateTable 的 主要 代码 为 : 





private void inflateTable(int toSize) { 
//Find a power of 2 >= toSize 
int capacity = roundUpToPowerOf2(toSize); 
threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_ CAPACITY + 1); 
table = new Entry[capacity]; 





默认 情况 下 ，capacity 的 值 为 16，threshold 会 变 为 12，table 会 分 配 一 
个 长 度 为 16 的 Entry 数 组 。 接 下 来 ， 检 查 key 是 否 为 null， 如 有 果 是 ， 调 用 
putForNullKey 单 独处 理 ， 我 们 暂时 忽略 这 种 情况 。 在 key 不 为 null 的 情况 
下 ， 下 一 步调 用 hash 方 法 计算 key 的 hash 值 。hash 方 法 的 代码 为 : 





final int hash(Object k) { 
int h= 0 
h A= k.hashCode( ); 
h ^A= (h >>> 20) ^ (h >>> 12); 
return h ^(h >>> 7) ^ (h >>> 4); 








基于 key 上 自身 的 hashCode 方 法 的 返回 值 又 进行 了 一 些 位 运算 ， 目 的 
是 为 了 随机 和 均匀 性 。 有 了 hash 值 之 后 ， 调 用 indexFor 方 法 ， 计 算 应 该 
将 这 个 键 值 对 放 到 table 的 哪个 位 置 ， 代 码 为 : 





static int indexFor(int h, int length) { 
return h & (length-1); 
} 

















HashMap 中 ，length 为 2 的 帘 次 方 ，h& (length-1) 等 同 于 求 模 运 算 
h%length。 找 到 了 保存 位 置 i，table[i] 指 向 一 个 单 向 链表 。 接 下 来 ， 就 是 
在 这 个 链表 中 逐个 查找 是 否 已 经 有 这 个 键 了 ， 遍 历代 码 为 : 








for (Entry<K,V> e = table[i]; e != null; e = e.next) 





而 比较 的 时 候 ， 是 先 比较 hash 值 ，hash 相 同 的 时 候 ， 再 使 用 equals 
方法 进行 比较 ， 代 码 为 : 





if(e.hash == hash && ((k = e.key) == key || key.equals(k))) 





为 什么 要 先 比较 hash 呢 ?因为 hash 是 整数 ， 比 较 的 性 能 一 般 要 比 
equals 高 很 多 ，hash 不 同 ， 束 没有 必要 调用 equals 方 法 了 ， 这 样 整体 上 可 
以 提高 比较 性 能 。 如 果 能 找到 ， 直 接 修 改 Entry 中 的 value 即 可 。 
modCount++ 的 含义 与 ArrayList 和 LinkedList 中 介绍 一 样 ， 为 记录 修改 次 
数 ， 方 便 在 迭代 中 检测 结构 性 变化 。 如 果 没 找到 ， 则 调用 addEntry 方 法 
在 给 定 的 位 置 添加 一 条 ， 代 码 为 : 





void addEntry(int hash, K key, V value, int bucketIndex) { 
if((size >= threshold) && (null != table[bucketIndex])) { 
resize(2 * table.length); 
hash = (null != key) ? hash(key) : 90; 
bucketIndex = indexFor(hash, table.length); 


createEntry(hash, key, value, bucketIndex); 


} 





如 果 空 间 是 够 的 ， 不 需要 resize， 则 调用 createEntry 方 法 添加 。 
createEntry 的 代码 为 : 





void createEntry(int hash, K key, V value, int bucketIndex) { 
Entry<K,V> e = table[bucketIindex]; 
table[bucketIndex] = new Entry<>(hash, key, value, e); 
SIZe++， 





代码 比较 直接 ， 新 建 一 个 Entry 对 象 ， 插 入 单 同 链表 的 涉 部 ， 并 增 
加 size。 如 果 空 间 不 够 ， 即 Size 已 经 要 超过 阔 什 threshold 了， 并 且 对 应 的 
table 位 置 已 经 插入 过 对 象 了 ， 有 具体 检查 代码 为 : 





if((size >= threshold) && (null != table[bucketIndex])) 





则 调用 resize 方 法 对 table 进 行 扩 展 ， 扩 展 人 策略 是 乘 2，resize 的 主要 代 
码 为 : 





void resize(int newCapacity) { 
Entry[] oldTable = table; 
int oldCapacity = oldTable.1length,; 
Entry[] newTable = new Entry[newCapacity]; 
transfer(newTable, initHashSeedAsNeeded(newCapacity)); 
table = newTable; 
threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM CAPACITY + 1); 








分 配 一 个 容量 为 原来 两 倍 的 Entry 数 组 ， 调 用 transfer 方 法 将 原来 的 
键 值 对 移植 过 来 ， 然 后 更 新 内 部 的 table 变 量 ， 以 及 threshold 的 值 。 
transfer 方 法 的 代码 为 : 





void transfer(Entry[] newTable, boolean rehash) { 
int newCapacity = newTable.length; 
for(Entry<K,V> e : table) { 
while(null != e) { 
Entry<K,V> next = e.next,; 
if(rehash) { 
e.hash = null == e.key ? 0 : hash(e.key); 


int i = indexFor(e.hash, newCapacity); 
e.next = newTable[i]; 

newTable[i] = e; 

e = next; 





参数 rehash 一 般 为 false。 这 段 代 码 遍 历 原来 的 每 个 键 值 对 ， 计 算 新 
位 置 ， 并 保存 到 新 位 置 ， 具 体 代码 比较 直接 ， 就 不 解释 了 。 


以 上 就 是 保存 键 值 对 的 主要 代码 ， 简 单 总 结 一 下 ， 基 本 步骤 为 : 
1) 计算 键 的 哈 希 值 ; 

2) 根据 哈 希 值得 到 保存 位 置 《 取 模 ) ; 

3) 插 到 对 应 位 置 的 链表 头 部 或 更 新 已 有 值 ; 

4) 根据 需要 扩展 table 大 小 。 


以 上 描述 可 能 比较 抽象 ， 我 们 通过 一 个 例子 ， 用 图 示 的 方式 进行 说 
明 ， 代 码 如 下 : 











Map<String, Integer> countMap = new HashMap<>(); 
countMap.put("hello", 1); 
countMap.put("world", 3); 
countMap.put("position", 4); 


在 通过 new HashMap 〈) 创建 一 个 对 象 后 ， 内 存 中 的 结构 如 图 10-1 
所 示 。 





Bo 
threshold 


图 10-1 HashMap: 初始 结构 


接 下 来 执行 保存 键 值 对 的 代码 ，"hello" 的 hash 值 为 96207088， 模 16 
的 结果 为 0， 所 以 插入 table[0] 指 向 的 链表 头 部 ， 内 存 结构 变 为 图 10-2 所 


人 钞 。 


"world" 的 hash 值 为 111207038， 模 16 结 果 为 14， 所 以 保存 
完 "world" 后 ， 内 存 结构 如 图 10-3 所 示 。 












保存 一 个 键 值 对 后 


图 10-2 ”HashMap 对 象 示例 : 
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| 本 二 证 
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9620708 


key_ 
value 
_next 
hash 


key | “world” 
value| 3 _ 
next | null 
11120703 
图 10-3 ”HashMap 对象 示例 ， 保 存 两 个 刍 值 对 后 


"position" 的 hash 值 为 771782464， 模 16 结 果 也 为 0，table[0] 已 经 有 节 
点 了 ， 新 节点 会 插 到 链表 头 部 ， 内 存 结 构 变 为 如 图 10-4 所 示 。 理 解 了 键 
值 对 在 内 存 是 如 何 存放 的 ， 残 比较 容易 理解 其 他 方法 了 。 
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图 10-4 。 HashMap 对 象 示例 : 保存 三 个 键 值 对 后 
4. 查 找 方法 
根据 键 获取 值 的 get 方 法 的 代码 为 : 









public V get(Object key) { 
if(key == null) 
return getForNullkey(); 
Entry<K,V> entry = getEntry(key); 
return null == entry ? null : entry.getValue(); 


} 





HashMap 支 持 key 为 null，key 为 null 的 时 候 ， 放 在 table[0]， 调 用 
getForNullKey〈) 获取 值 ， 如 果 key 不 为 nall， 则 调用 getEntry〈) 获取 
键 值 对 节点 entry， 然 后 调用 节点 的 getValue 〈) 方法 获取 值 。getEntry 方 
法 的 代码 是 : 





final Entry<K,V> getEntry(Object key) { 
if(size == 0) { 
return null; 


} 
int hash = (key == null) ? 0 : hash(key); 


for(Entry<K,V> e = table[indexFor(hash, table.length)]; 
e != null; e = e.next) { 
Object k; 
if(e.hash == hash && 
((k = e.key) == key || (key != null && key.equals(k)))) 
return e; 


return null; 





逻辑 也 比较 人 简单， 具体 如 下 。 
1) 计算 键 的 hash 值 ， 代 码 为 : 





int hash = (key == null) ? 0 : hash(key); 





2) 根据 hash 找 到 table 中 的 对 应 链表 ， 代 码 为 : 





table[indexFor(hash, table.length)]; 





3) 在 链表 中 裔 历 合 找 ， 表 历代 人 码 : 





for(Entry<K,V> e = table[indexFor(hash, table.length)]; 
e != null; e = e.next) 





4) 逐个 比较 ， 先 通过 hash 快 速 比 较 ，hash 相 同 再 通过 equals 比 较 ， 
代码 为 : 





if(e.hash == hash && 
((k = e.key) == key || (key != null && key.equals(k)))) 





containsKey 方 法 的 逻辑 与 get 是 类 似 的 ， 节 点 不 为 nu 就 表示 存在 ， 
具体 代码 为 : 





public boolean containsKey(Object key) { 
return getEntry(key) != null,; 
} 








HashMap 可 以 方便 高 效 地 按照 键 进行 操作 ， 但 如 果 要 根据 值 进行 操 
作 ， 则 需要 遍历 ，containsValue 方 法 的 代码 为 : 





public boolean containsValue(O0bject value) { 
if(value == null) 
return containsNullVvalue( ); 
Entry[] tab = table; 
for(int i = 0; i < tab.length ; i++) 
for(Entry e = tab[i] ; e != null ; e = e.next) 
if(value.equals(e.value)) 
return true; 
return false; 





如 果 要 查找 的 值 为 null， 则 调用 containsNullValue 单 独处 理 ， 如 果 要 
得 找 的 值 不 为 nul， 通 历 的 逻辑 也 很 简单 ， 就 是 从 table 的 第 一 个 链表 开 
始 ， 从 上 到 下 ， 从 左 到 右 逐 个 节点 进行 访问 ， 通 过 equals 方 法 比较 值 ， 
直到 找到 为 止 。 


5. 根 据 键 删除 键 值 对 
根据 键 删除 键 值 对 的 代码 为 : 





public V remove(Object key) { 
Entry<K,V> e = removeEntryForKey(key ) ， 
return(e == null ? null : e.value); 





removeEntryForKey 的 代码 为 : 





final Entry<K,V> removeEntryForKey(Object key) { 
if(size == 0) { 
return null; 


} 
int hash = (key == null) ? 0 : hash(key); 
int i = indexFor(hash, table.length); 
Entry<K,V> prev = table[i]; 
Entry<K,V> e = prev; 
while(e != null) { 
Entry<K,V> next = e.next,; 
Object k; 
if(e.hash == hash && 
((k = e.key) == key || (key != null && key.equals(k)))) { 
modCount++; 
Size--，; 
if(prev == e) 
table[i] = next; 


else 
prev.next = next; 
e.recordRemoval(this); 
return e; 
} 
prev = e; 
e = next; 


return e; 





基本 逻辑 分 析 如 下 。 
1) 计算 hash， 根 据 hash 找 到 对 应 的 table 索 引 ， 代 码 为 : 





int hash = (key == null) ? 0 : hash(key); 
int i = indexFor(hash, table.length); 





2) 避 历 table[i]， 但 找 等 删 季 点 ， 使 用 变量 prev 指 癌 前 一 个 节 扣 ， 
next 指 向 后 一 个 市 态 ，e 指 癌 当 前 节点 ， 避 历 结 构 代 码 为 : 





Entry<K,V> prev = table[i]; 
Entry<K,V> e = prev; 
while(e != null) { 
Entry<K,V> next = e.next,; 
if( 找 到 了 ) 
// 删 除 
return 
} 
prev = e; 
e = next; 


} 





3) 判断 是 否 找 到 ， 依 然 是 先 比较 hash 值 ，hash 值 相同 时 再 用 equals 
方法 比较 。 


4) 删除 的 逻辑 就 是 让 长 度 减 小 ， 然 后 让 待 删节 点 的 前 后 节点 链 起 
来 ， 如 果 符 删 证 点 是 第 一 个 节点 ， 则 让 table 息 直接 指 癌 后 一 个 节点 ， 代 
码 为 : 





Size--,; 
if(prev == e) 
table[i] = next; 
else 
prev.next = next; 


e.recordRemoval (this) ; 在 HashMap 中 代码 为 衬 ， 主 要 是 为 了 
HashMap 的 子 类 扩展 使 用 。 


6. 实 现 原 理 小 结 


以 上 就 是 HashMap 的 基本 实现 原理 ， 内 部 有 一 个 哈 希 表 ， 即 数组 
table， 每 个 元 素 table[i] 指 同一 个 单 同 链表 ， 根 据 键 存 取 值 ， 用 键 算出 
hash 值 ， 取 模 得 到 数组 中 的 索引 位 置 buketIndex， 人 然后 操作 
table[buketIndex] 指 同 的 单 同 链表 。 


存 取 的 时 候 依据 键 的 hash 值 ， 只 在 对 应 的 链表 中 操作 ， 不 会 访问 别 
的 链表 ， 在 对 应 链表 操作 时 也 是 先 比 较 hash 值 ， 如 果 相 同 再 用 equals 方 
法 比较 。 这 就 要 求 ， 相 同 的 对 象 其 hashCode 返 回 值 必须 相同 ， 如 果 键 是 
上 自 定 义 的 类 ， 束 特别 需要 注意 这 一 点 。 这 也 是 hash-Code 和 equals 方 法 的 
一 个 关键 约束 。 


需要 说 明 的 是 ，Java 8 对 HashMap 的 实现 进行 了 优化 ， 在 哈 希 冲突 
比较 严重 的 情况 下 ， 即 大 量 元 素 映 射 到 同一 个 链表 的 情况 下 (具体 是 至 
少 8 个 元 素 ， 且 总 的 键 值 对 个 数 至 少 是 64) ，Java 8 会 将 该 链表 转换 为 一 
个 平衡 的 排序 二 叉 树 ， 以 提高 查询 的 效率 ， 关 于 排序 二 又 树 我 们 在 10.3 
节 介 绍 ，Java 8 的 具体 代码 就 不 介绍 了 。 














10.1.4 ”小结 


本 节 介绍 了 HashMap 的 用 法 和 实现 原理 ， 它 实现 了 Map 接 口 ， 可 以 
方便 地 按照 键 存 取 值 ， 内 部 使 用 数组 链表 和 哈 希 的 方式 进行 实现 ， 这 决 
定 了 它 有 如 下 特 后 ; 


1) 根据 键 保 存 和 获取 值 的 效率 都 很 高 ， 为 0 〈1) ， 每 个 单 丫 链表 
往往 只 有 一 个 或 少数 儿 个 节点 ， 根 据 hash 值 就 可 以 直接 快速 定位 ; 

2) HashMap 中 的 键 值 对 没有 顺序 ， 因 为 hash 值 是 随机 的 。 

如 果 经 常 需要 根据 键 存 取 值 ， 而 且 不 要 求 顺序 ， 那 么 HashMap 就 是 


理想 的 选择 。 如 果 要 保持 添加 的 顺序 ， 可 以 使 用 HashMap 的 一 个 子 类 
LinkedHashMap， 我 们 在 10.6 节 介绍 。Map 还 有 一 个 重要 的 实现 类 














TreeMap， 它 可 以 排序 ， 我 们 在 10.4 市 介绍 。 


需要 说 明 的 是 ，HashMap 不 是 线程 安全 的 ，Java 中 还 有 一 个 类 
Hashtable， 它 是 Java 最 早 实现 的 容器 类 之 一 ， 实 现 了 了 Map 接口， 实现 原 
理 与 HashMap 类 似 ， 但 没有 特别 的 优化 ， 它 内 部 通过 synchronized 实 现 
了 线程 安全 。 在 HashMap 中 ， 键 和 值 都 可 以 为 null， 而 在 Hashtable 中 不 
可 以 。 在 不 需要 并 发 安全 的 场景 中 ， 推 荐 使 用 HashMap。 在 高 并 发 的 场 
景 中 ， 推 荐 使 用 17.2 节 介绍 的 ConcurrentHashMap。 


根据 蛤 希 值 存 取 对 象 、 比 较 对 象 是 计算 机 程序 中 一 种 重要 的 思维 方 
式 ， 它 使 得 存 取 对 象 主要 依赖 于 自身 Hash 值 ， 而 不 是 与 其 他 对 象 进行 比 
较 ， 存 取 效 率 也 与 集合 大 小 无 大 ， 高 达 O《〈1) ， 即 使 进行 比较 ， 也 利 
用 Hash 值 提高 比较 性 能 。 








10.2 ” 放 析 HashSet 


10.1 节 提 到 了 Set 接 口 ，Map 接 口 的 两 个 方法 keySet 和 entrySet 返 回 的 
都 是 Set， 本 节 介 绍 Set 接 口 的 一 个 重要 实现 类 HashSet。 与 HashMap 类 
似 ， 字 面 上 看 ， HashSet 由 两 个 单词 组 成 Hash 和 Set。 其 中 ，Set 表 示 接 
口 ， 实 现 Set 接 口 也 有 多 种 方式 ， 各 有 特点 ，Hash- Set 实 现 的 方式 利用 了 
Hash。 下 面 ， 我 们 先 来 看 HashSet 的 用 法 ， 然 后 看 实现 原理 ， 最 后 总 结 
分 析 HashSet 的 特点 。 


10.2.1 用 法 


我 们 先 介 绍 Set 接 口 ， 然 后 介绍 HashSet 的 使 用 和 应 用 场景 。 

Set 表 示 的 是 没有 重复 元 素 、 且 不 保证 顺序 的 容器 接口 ， 它 扩展 了 
Collection， 但 没有 定义 任何 新 的 方法 ， 不 过 ， 对 于 其 中 的 一 些 方法 ， 
有 自己 的 规范 。Set 接 口 的 完整 定义 如 代码 清单 10-3 所 示 。 


代码 清单 10-3 ”Set 接口 




















public interface Set<E> extends Collection<E> { 

int size(); 

boolean isEmpty(); 

boolean contains(Object 0); 

// 和 迭代 遍历 时 ， 不 要 求 元 素 之 间 2 

//HashSet 的 实现 就 是 没有 顺序 ， 但 有 的 Set 实 现 可 能 会 有 特定 的 顺序 ， 比 如 TreeSet 
Iterator<E> iterator(); 

Object[] toArray(); 

<T> T[] toArray(T[] a); 
// 添 加 元 素 ， 如 果 集合 中 已 经 存在 相同 元 素 了 ， 则 不 会 改变 集合 ， 直 接 返 回 false， 
// 只 有 不 存在 时 ， 才 会 添加 ， 并 返回 true 

boolean add(E e); 

boolean remove(Object 0o); 

boolean containsAll(Collection<?> c); 

// 重 复 的 元 素 不 添加 ， 不 重复 的 添加 ， 如 果 集 合 有 变化 ， 返 回 true， 没 变化 返回 false 
boolean addAll(Collection<? extends E> c); 

boolean retainAll(Collection<?> c); 

boolean removeAll(Collection<?> c); 

void clear(); 

boolean equals(Object 0); 

int hashCode( ); 
























































































































































二 一 


与 HashMap 类 似 ，HashSet 的 构造 方法 有 : 





public HashSset() 

public HashSet(int initialCapacity) 

public HashSet(int initialCapacity，float loadFactor) 
public HashSet(Collection<? extends E> c) 





initialCapacity 和 ]loadFactor 的 含义 与 HashMap 中 的 是 一 样 的 。 
HashSet 的 使 用 也 很 简单 ， 比 如 : 





Set<String> set = new HashSet<String>(); 
set.add("hello"); 
set.add( "world"); 
set.addAll(Arrays.asList(new String[]{"hello", " 老 马 "})); 
for(String s : Set){ 

System.out.print(s+" "); 
} 





输出 为 : 





hello 老 马 world 





可 "hello" 被 添加 了 两 次 ， 但 只 会 保存 一 份 ， 输 出 也 没有 什么 特别 的 顺 
了 了。 





与 HashMap 类 似 ，HashSet 要 求 元 素 重 写 hashCode 和 equals 方 法 ， 且 
对 于 两 个 对 象 ， 如 果 equals 相 同 ， 则 hashCode 也 必须 相同 ， 如 宋 元 素 是 
自 定义 的 类 ， 需 要 注意 这 一 点 。 比 如 ， 有 一 个 表示 规格 的 类 Spec， 有 大 
小 和 颜色 两 个 属性 : 








class Spec { 
String size,; 
String color; 
public Spec(String size, String color) { 
this.size = size; 
this.color = Color 


Q@Override 
public String toString() { 
return "[size=" + size + ", Color=" + color + "]"; 


Spec 的 Set 为 : 





Set<Spec> Set = new HashSet<Spec>(); 
set.add(new Spec("M"，"red") )， 
set.add(new Spec("M"，"red") )， 
System,.out.println(set); 





输出 为 : 





[[size=M, color=red], [size=M, color=red]] 





同一 个 规格 输出 了 两 次 ， 为 避免 这 一 点 ， 需 要 为 Spec 重 写 hashCode 
和 equals 方 法 。 利 用 IDE 开 发 工具 往往 可 以 自动 生成 这 两 个 方法 ， 比 如 
Eclipse 中 ， 可 以 通过 "Source"->"Generate hashCode () and 
equals〈) ..."， 我 们 就 不 袭 述 了 。 


HashSet 有 很 多 应 用 场景 ， 比 如 : 


1) 排 重 ， 如 果 对 排 重 后 的 元 系 没 有 顺序 要 求 ， 则 HashSet 可 以 方便 
地 用 于 排 重 ; 


2) 保存 特殊 值 ，Set 可 以 用 于 保存 各 种 特殊 值 ， 程 序 处 理 用 户 请 求 
或 数据 记录 时 ， 根 据 是 否 为 特殊 值 判断 是 否 进 行 特殊 处 理 ， 比 如 保存 IP 
地 址 的 黑 名 单 或 白 名 单 ; 


3) 集合 运算 ， 使 用 Set 可 以 方便 地 进行 数学 集合 中 的 运算 ， 如 区 
集 、 并 集 等 运算 ， 这 些 运 算 有 一 些 很 现实 的 意义 。 比 如 ， 用 户 标签 计 
算 ， 每 个 用 户 都 有 一 些 标签 ， 两 个 用 户 的 标签 交集 就 表示 他 们 的 共同 特 
征 ， 交 集 大 小 除 以 并 集 大 小 可 以 表示 他 们 的 相似 程度 。 








10.2.2 ”实现 原理 


HashSet 内 部 是 用 HashMap 实 现 的 ， 它 内 部 有 一 个 HashMap 实 例 变 
量 ， 如 下 所 示 : 





private transient HashMap<E, Object> map 





我 们 知道 ，Map 有 键 和 值 ，HashSet 相 当 于 只 有 键 ， 值 都 是 相同 的 固 
定 值 ， 这 个 值 的 定义 为 : 





private static final Object PRESENT = new Object() 








理解 了 这 个 内 部 组 成 ， 它 的 实现 方法 也 束 比 较 容易 理解 了， 我 们 来 
看 下 代码 。 


HashSet 的 构造 方法 ， 主 要 就 是 调用 了 对 应 的 HashMap 的 构造 方 
法 ， 比如 : 





public HashSet(int initialCapacity, float loadFactor) { 
map = new HashMap<>(initialCapacity, loadFactor); 





接受 Collection 参 数 的 构造 方法 稍微 不 一 样 ， 代 码 为 : 





public HashSet(Collection<? extends E> c) 
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16)); 
addAll(c); 





也 很 容易 理解 ，c.size《〈) /.75f 用 于 计算 initialCapacity，0.75f 是 
loadFactor 的 默认 值 。 


我 们 看 add 方 法 的 代码 : 





public boolean add(E e) { 
return map.put(e, PRESENT)==null; 





就 是 调用 map 的 put 方 法 ， 元 素 e 用 于 键 ， 值 就 是 固定 值 PRESENT， 
put 返 回 null 表 示 原 来 没有 对 应 的 键 ， 添 加 成 功 了 。HashMap 中 一 个 键 只 
会 保存 一 份 ， 所 以 重复 添加 HashMap 不 会 变化 。 











检查 是 否 包 仿 元素， 代码 为 : 








public boolean contains(Object o) { 
return map.containskKey(o); 


} 








就 是 检查 map 中 是 人 否 包含 对 应 的 键 。 
删除 元 素 的 代码 为 : 





public boolean remove(Object o) { 
return map.remove(o)==PRESENT; 
} 





就 是 调用 map 的 remove 方 法 ， 返 回 值 为 PRESENT 表 示 原 来 有 对 应 的 
键 且 删除 成 功 了 。 


迭代 器 的 代码 为 : 





public Iterator<E> iterator() { 
return map.keysSet().iterator(); 


} 





就 是 返回 map 的 keySet 的 和 迭 代 器 。 
102.3 四 第 


本 节 介 绍 了 HashSet 的 用 法 和 实现 原理 ， 它 实现 了 Set 接 口 ， 内 部 实 
现 利 用 了 HashMap， 有 如 下 特点 : 


1) 没有 重复 元 素 ; 


2) 可 以 高 效 地 添加 、 删 除 元 素 、 判 断 元 素 是 否 存 在 ， 效 率 都 为 
O (1) ; 


3) 没有 顺序 。 


10.3 ”排序 二 又 树 


HashMap 和 HashSet 的 共同 实现 机 制 是 哈 希 表 ， 一 个 共同 的 限制 是 
没有 顺序 ， 我 们 提 到 ， 它 们 都 有 一 个 能 保持 顺序 的 对 应 类 类 TreeMap 和 
TreeSet， 这 两 个 类 的 共同 实现 基础 是 排序 二 叉 树 。 为 了 更 好 地 理解 
TreeMap 和 TreeSet， 本 节 先 介绍 排序 二 又 树 的 一 些 基 本 概念 和 算法 。 











10.3.1 基本 概念 


先 来 说 树 的 概念 。 现 实 中 ， 树 是 从 下 往 上 长 的 ， 树 会 分 又 ， 在 计算 
机 程序 中 ， 一 般 而 言 ， 与 现实 相反 ， 树 是 从 上 往 下 长 的 ， 也 会 分 又 ， 有 
个 根 节操 ， 每 个 节 扣 可 以 有 一 个 或 多 个 孩子 节 乓 ， 没 有 孩子 节 扣 的 节点 
一 般 称 为 叶子 市 点 。 


二 文 树 是 一 樟树 ， 每 个 节点 最 多 有 两 个 孩子 节点 ， 一 左 一 右 ， 左 边 
的 称 为 左 孩 子 ， 右 边 的 称 为 右 孩 子 ， 示 例如 图 10-5 所 示 。 


图 10-5 中 ， 两 棵 树 都 是 二 又 树 ， 图 10-5 (a)〉 所 示 二 叉 树 的 根 节点 为 
5， 除 了 叶子 节点 外 ， 每 个 节点 都 有 两 个 孩子 节点 ;图 10-5 (b) 所 示 二 
又 树 的 根 节 点 为 7， 有 的 节点 有 两 个 孩子 节点 ， 有 的 只 有 一 个 。 树 有 一 
个 高 度 或 深度 的 概念 ， 是 从 根 到 叶子 节点 经 过 的 节点 个 数 的 最 大 值 ， 左 
边 树 的 高 度 为 3， 夺 边 树 的 高 度 为 5。 


排序 二 叉 树 也 是 二 叉 树 ， 但 它 没有 重复 元 素 ， 而 且 是 有 序 的 二 叉 
树 。 什 么 顺序 昵 ?对 每 个 节点 而 言 : 


如果 左 子 树 不 为 空 ， 则 左 子 树 上 的 所 有 节点 都 小 于 该 节 反 ; 

:如果 右 子 树 不 为 室 ， 则 右 子 树 上 的 所 有 节点 都 大 于 该 节点 。 

图 10-5 中 的 两 棵 二 叉 树 部 是 排序 二 叉 树 。 比 如 左边 的 树 ， 根 市 点 为 
5， 左 边 的 都 小 于 5， 右 边 的 都 大 于 5。 再 看 右边 的 树 ， 根 节点 为 7， 左 边 


1 右边 的 都 大 于 7， 在 以 3 为 根 的 左 子 树 中 ， 其 右 子 树 的 值 都 
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图 10-5 ”二叉树 示例 
10.3.2 ”基本 算法 


排序 二 叉 树 有 什么 优点 ?如 何在 树 中 进行 基本 操作 (如 查找 、 遍 
历 、 插 入 和 删除 ) 呢 ? 我 们 来 看 一 下 基本 的 算法 。 


1. 查 找 


排序 二 又 树 有 一 个 很 好 的 优点 ， 在 其 中 碍 找 一 个 元 素 时 很 方便 、 也 
很 高 效 ， 基 本 步骤 为 : 


1) 首先 与 根 节 点 比较 ， 如 果 相 同 ， 就 找到 了 ; 
2) 如 果 小 于 根 节 点 ， 则 到 左 子 树 中 递归 奉 找 ; 
3) 如 果 大 于 根 节 点 ， 则 到 右 子 树 中 递归 奉 找 。 
这 个 步骤 与 在 数组 中 进行 二 分 碍 找 的 思路 是 类 似 的 ， 如 果 二 又 树 是 


比较 平衡 的 ， 类 似 图 10-5 a》 所 示 二 叉 树 ， 则 每 次 比较 都 能 将 比较 范 
围 缩小 一 半 ， 效 率 很 高 。 





此 外 ， 在 排序 二 叉 树 中 ， 可 以 方便 地 碍 找 最 小 值 和 最 大 值 。 基 小 值 
即 为 最 左边 的 节点 ， 从 根 节 点 一 路 查找 左 孩子 即 可 ;最 大 值 即 为 最 右边 
的 节点 ， 从 根 节 点 一 路 碍 找 右 孩 子 即 可 。 


2. 通 历 


排序 二 又 树 也 可 以 方便 地 按 序 通 历 。 用 递归 的 方式 ， 用 如 下 算法 即 
可 按 序 允 历 


1) 访问 左 子 树 ; 

2) 访问 当前 节点 ; 

3) 访问 右 子 树 。 

比如 ， 遍 历 访问 图 10-6 所 示 的 二 又 树 。 

从 根 节点 开始 ， 但 先 访问 根 节点 的 左 子 树 ， 一 直到 最 左边 的 节点 ， 
所 以 第 一 个 访问 的 是 1，1 没 有 右 子 树 ， 返 回 上 一 层 ， 访 问 3， 然 后 访问 3 
的 右 子 树 ，4 没 有 左 子 树 ， 所 以 访问 4， 然 后 是 4 的 右 子 树 6， 以 此 类 推 ， 
访问 顺序 就 是 有 序 的 : 1、3、4、6、7、8、9。 

不 用 递归 的 方式 ， 也 可 以 实现 按 序 人 遍历， 第 一 个 节点 为 最 左边 的 节 
点 ， 从 第 一 个 节点 开始 ， 依 次 找 后 继 节点 。 给 定 一 个 节点 ， 找 其 后 继 节 
点 的 算法 为 

1) 如 果 该 节点 有 右 孩 子 ， 则 后 继 节点 为 右 子 树 中 最 小 的 节点 。 

2) 如 果 该 节点 没有 右 孩 子 ， 则 后 继 节 点 为 父 节 点 或 某 个 祖先 节 
点 ， 从 当前 节点 往 上 找 ， 如 琳 它 是 父 节 扩 的 石 按 了 了 ， 则 继续 找 父 节点 


直到 它 不 是 右 孩子 或 父 节 点 [为 二 ， 第 一 个 非 有 孩子 节点 的 父 节点 就是 后 
继 节 点 ， 如 果 找 不 到 这 样 的 祖先 节点 ， 则 后 继 为 空 ， 巡 历 结束 。 


文字 描述 比较 抽象 ， 我 们 来 看 个 图 ， 以 图 10-6 为 例 ， 每 个 大 点 的 后 
继 节点 如 图 10-7 浅 色 箭 头 所 示 。 
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图 10-7 ”排序 二 又 树 节 点 后 继 
对 每 个 节点 ， 对 照 算法 ， 我 们 再 详细 解释 下 : 





1) 第 一 个 节点 1 没有 右 孩 子 ， 它 不 是 父 闻 后 的 右 孩 子 ， 所 以 它 的 后 
继 节 点 就 是 其 父 节 点 3; 
2) 3 有 右 孩 子 ， 右 子 树 中 最 小 的 束 是 4， 所 以 3 的 后 继 节点 为 4; 


3) 4 有 右 和 孩子， 石子 树 中 只 有 一 个 节点 6， 所 以 4 的 后 继 节 点 为 6; 
4) 6 没有 右 孩 子 ， 往 上 找 父 节点 ， 它 是 父 节 点 4 的 右 孩 子 ，4 又 是 父 
节点 3 的 右 孩 子 ，3 不 是 父 节 点 7 的 右 孩 子 ， 所 以 6 的 后 继 节 点 为 3 的 父 节 
点 7; 


5) 7 有 右 孩 子 ， 右 子 树 中 最 小 的 是 8， 所 以 7 的 后 继 节 点 为 8; 


6) 8 没有 右 孩子 ， 往 上 找 父 节点 ， 它 不 是 父 节点 9 的 右 孩 子 ， 所 以 
它 的 后 继 节点 就 是 其 父 节点 9， 


7) 9 没有 右 孩 子 ， 往 上 找 父 节 点 ， 它 是 父 刷 点 7 的 右 孩 子 ， 接 着 往 
上 找 ， 但 7 已 经 是 根 节点 ， 父 节点 为 室 ， 所 以 后 继 为 空 。 


怎么 构建 排序 二 又 树 呢 ? 可 以 在 插入 、 删 除 元 系 的 过 程 中 形成 和 保 




















3. 插 入 


在 排序 二 文 树 中 ， 插 入 元 素 首 先 要 找 插入 位 置 ， 即 新 节点 的 父 市 
扩 ， 怎 么 找 呢 ? 与 查找 元 素 类 似 ， 从 根 节 点 开始 往 下 找 ， 其 步 又 为 : 


1) 与 当前 节点 比较 ， 如 果 相 同 ， 表 示 已 经 存在 了， 不 能 再 插入 :; 


2) 如 果 小 于 当前 节点 ， 则 到 左 子 树 中 寻找 ， 如 果 左 子 树 为 空 ， 则 
当前 节点 即 为 要 找 的 父 布 后; 


3) 如 果 大 于 当前 节点 ， 则 到 右 子 树 中 寻找 ， 如 果 石 子 树 为 空 ， 则 
当前 节点 即 为 要 找 的 父 布 后。 


找到 父 节 点 后 ， 即 可 插入 ， 如 果 插 入 元 素 小 于 父 节点 ， 则 作为 左 孩 
子 插入 ， 否 则 作为 右 孩 子 插入 。 我 们 来 看 个 例子 ， 依 次 插入 7、3、4、 
1、9、6、8 的 过 程 ， 这 个 过 程 如 图 10-8 所 示 。 
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图 10-8 排序 二 又 树 插入 过 程 
4. 删 除 
从 排序 二 又 树 中 删除 一 个 节点 要 复杂 一 些 ， 有 三 种 情况 : 
节点 为 叶子 节点 ; 
节点 只 有 一 个 孩子 节点 ; 
:节点 有 两 个 孩子 节点 。 


我 们 分 别 介绍 。 


如 末节 点 为 叶子 节点 ， 则 很 简单 ， 可 以 下 接 删 控 ， 修 改 父 市 扣 的 对 
应 孩子 市 反 为 空 即 可 。 


如 果 节 点 只 有 一 个 孩子 节点 ， 则 替换 待 删 节点 为 孩子 节点 ， 或 者 
说 ， 在 孩子 节点 和 父 节 点 之 间 直 接 建 立 链接 。 比 如 ， 在 图 10-9 中 ， 左 边 
ee 0 
将 。 
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图 10-9 排序 二 又 树 删除 节点 : 节点 只 有 一 个 孩子 节点 的 情况 


如 果 节 点 有 两 个 孩子 节点 由 ， 则 首先 找 该 节点 的 后 继 节 点 ， 找 到 
后 继 节 点 后 ， 蔡 换 待 删节 点 为 后 继 节点 的 内 容 ， 然 后 再 删除 后 继 节 点 。 
后 继 节 点 没有 左 孩 子 ， 这 就 将 两 个 孩子 节点 的 情况 转换 为 了 叶子 节点 或 
只 有 一 个 孩子 节点 的 情况 。 比 如 ， 在 图 10-10 中 ， 从 左边 二 又 树 中 删除 
节点 3，3 有 两 个 孩子 节点 ， 后 继 节点 为 4， 首 先 蔡 换 3 的 内 容 为 4， 然 后 
再 删除 节点 4。 
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图 10-10 ”排序 二 又 树 删除 节点 : 节点 有 两 个 孩子 节点 的 情况 
10.3.3 “平衡 的 排序 二 又 树 


从 前 面 的 描述 中 可 以 看 出 ， 排 序 二 又 树 的 形状 与 插入 和 删除 的 顺序 
密切 相关 ， 极 问 情 况 下 ， 排 序 二 又 树 可 能 退化 为 一 个 链表 。 比 如 ， 如 宁 


插入 顺序 为 1、3、4、6、7、8、9， 则 排序 二 又 树 如 图 10-11 所 示 。 


图 10-11 退化 的 排序 二 又 树 


退化 为 链表 后 ， 排 序 二 又 树 的 优点 融 都 没有 了 ， 即 使 没有 退化 为 链 
表 ， 如 果 排 序 二 又 树 高 度 不 平衡 ， 效 率 也 会 变 得 很 低 。 


平衡 具体 定义 是 什么 呢 ? 有 一 种 高 度 平 衡 的 定义 ， 即 任何 节点 的 左 
右 子 树 的 高 度 差 最 多 为 一 。 满 足 这 个 平衡 定义 的 排序 二 又 树 又 被 称 关 
AVL 树 ， 这 个 名 字源 于 它 的 发 明 者 G.M.Adelson-Velsky 和 E.M.Landis。 
在 插入 和 删除 节点 时 ， 通 过 一 次 或 多 次 旋转 操作 来 重 
新 平衡 树 。 


在 TreeMap 的 实现 中 ， 用 的 并 不 是 AVL 树 ， 而 是 红 黑 树 ， 与 AVL 树 
类 似 ， 红 黑 树 也 是 一 种 平衡 的 排序 二 叉 树 ， 也 是 在 插入 和 删除 节点 时 通 
过 旋转 操作 来 平衡 的 ， 但 它 并 不 是 高 度 平衡 的 ， 而 是 大 致 平衡 的 。 所 谓 
大 致 是 指 ， 它 确保 任意 一 条 从 根 到 叶子 节点 的 路 径 ， 没 有 任何 一 条 路 径 
的 长 度 会 比 其 他 路 径 长 过 两 倍 。 红 黑 树 减弱 了 对 平衡 的 要 求 ， 但 降低 了 
保持 平衡 需要 的 开销 ， 在 实际 应 用 中 ， 统 计 性 能 高 于 AVL 树 。 


为 什么 叫 红 黑 树 呢 ? 因为 它 对 每 个 节点 进行 着 色 ， 颜 色 或 黑 或 红 ， 
并 对 节点 的 着 色 有 一 些 约束 ， 满 足 这 个 约束 即 可 以 确保 树 是 大 致 平衡 


























的 。 


对 AVL 树 和 红 黑 树 ， 它 们 保持 平衡 的 细节 都 是 比较 复杂 的 ， 我 们 就 
不 介绍 了 ， 需 要 知道 的 是 ， 它 们 都 是 排序 二 又 树 ， 都 通过 在 插入 和 删除 
时 执行 开销 不 大 的 旋转 操作 保持 了 树 的 高 度 平 衡 或 大 致 平衡 ， 从 而 保证 
了 树 的 查找 效率 。 





1034， 本 结 


本 小 节 介 绍 了 排序 二 又 树 的 基本 概念 和 算法 。 


排序 二 又 树 保 持 了 元 素 的 顺序 ， 而 且 是 一 种 综合 效率 很 高 的 数据 结 
构 ， 基 本 的 保存 、 删 除 、 碍 找 的 效率 都 为 0 Ch) ，h 为 树 的 高 度 。 在 树 
平衡 的 情况 下 ，h 为 log。 〈N) ，N 为 节点 数 。 比 如 ， 如 果 N 为 1024， 则 
log。 (CN ) 为 10。 








基本 的 排序 二 又 树 不 能 保证 树 的 平衡 ， 可 能 退化 为 一 个 链表 。 有 很 
多 保持 树 平衡 的 算法 ，AVL 树 能 保证 树 的 高 度 平 衡 ， 但 红 黑 树 是 实际 中 
使 用 更 为 广泛 的 ， 昌 然 红 黑 树 只 能 保证 大 致 平衡 ， 但 降低 了 维持 树 乎 衡 
需要 的 开销 ， 整 体 统计 效果 更 好 。 


与 哈 希 表 一 样 ， 树 也 是 计算 机 程序 中 一 种 重要 的 数据 结构 和 思维 方 
式 。 为 了 能 够 快速 操作 数据 ， 哈 希 和 树 是 两 种 基本 的 思维 方式 ， 不 需要 
顺序 ， 优 先 考 感 哈 希 ， 需 要 有 顺序， 考虑 树 。 除 了 容器 类 
TreeMap/TreeSet， 数 据 库 中 的 索引 结构 也 是 基于 树 的 〈 不 过 基于 B 树 ， 
而 不 是 二 又 树 ) ， 而 索引 是 能 够 在 大 量 数据 中 快速 访问 数据 的 关键 。 


理解 了 排序 二 义 树 的 基本 概念 和 算法 ， 理 解 TreeMap 和 TreeSet 就 比 
较 容 易 了 ， 让 我 们 在 接 下 来 的 小 节 中 探讨 这 两 个 类 。 


[1] 根据 之 前 介绍 的 后 继 算法 ， 后 继 节 点 为 石子 树 中 最 小 的 节点 ， 这 个 
后 继 节 点 一 定 没 有 左 孩 子 节 点 。 








10.4 剖析 TreeMap 


在 介绍 HashMap 时 ， 我 们 提 到 ，HashMap 有 一 个 重要 局 限 ， 键 值 对 
之 间 没 有 特定 的 顺序 ， 我 们 还 提 到 ，Map 接 口 有 另 一 个 重要 的 实现 类 
TreeMap， 在 TreeMap 中 ， 键 值 对 之 间 按 键 有 序 ，TreeMap 的 实现 基础 是 
排序 二 叉 树 ，10.3 节 介绍 了 排序 二 叉 树 的 基本 概念 和 算法 ， 本 节 我 们 来 
详细 讨论 TreeMap。 除 了 Map 接 口 ， 因 为 有 序 ，TreeMap 还 实现 了 更 多 接 
口 和 方法 。 下 面 ， 我 们 先 来 介绍 TreeMap 的 用 法 ， 然 后 介绍 其 内 部 实 
现 。 








10.4.1 基本 用 法 


TreeMap 有 两 个 基本 构造 方法 : 





public TreeMap() 
public TreeMap(Comparator<? super K> comparator) 





第 一 个 为 默认 构造 方法 ， 如 果 使 用 默认 构造 方法 ， 要 求 Map 中 的 键 
实现 Comparabe 接 口 ，TreeMap 内 部 进行 各 种 比较 时 会 调用 键 的 
Comparable 接 口中 的 compareTo 方 法 。 


第 二 个 接受 一 个 比较 器 对 象 comparator， 如 果 comparator 不 为 null， 
在 TreeMap 内 部 进行 比较 时 会 调用 这 个 comparator 的 compare 方 法 ， 而 不 
再 调用 键 的 compareTo 方 法 ， 也 不 再 要 求 键 实现 Comparable 接 口 。 


应 该 用 哪 一 个 呢 ? 第 一 个 更 为 简单 ， 但 要 求 键 实 现 Comparable 接 
口 ， 且 期 望 的 排序 和 键 的 比较 结果 是 一 致 的 ， 第 二 个 更 为 灵活 ， 不 要 求 
键 实现 Comparable 接 口 ， 比 较 器 可 以 用 灵活 复杂 的 方式 进行 实现 。 


需要 强调 的 是 ，TreeMap 古 按键 而 不 是 按 值 有 序 ， 无 论 哪 一 种 ， 都 
征 对 键 而 非 值 进行 比较 。 


看 段 简 单 的 示例 代码 : 











Map<String，String> map = new TreeMap<>(); 

map.put("a", "abstract"); 

map.put("c", "call"); 

map.put("b", "basic"); 

map.put("T", "tree"); 

for(Entry<String,String> kv : map.entrySet())t{ 
System.out.print(kv.getkey()+"="+kv.getValue()+" "); 

} 





创建 了 一 个 TreeMap， 但 只 是 当 作 Map 使 用 ， 不 过 迭 代 时 ， 其 输出 
却 是 按键 排序 的 ， 输 出 为 : 





T=tree a=abstract b=basic c=call 














T 排 在 最 前 面 ， 是 因为 大 写字 母 的 ASCII 码 都 小 于 小 写字 母 。 如 果 
名望 忽略 大 小 写 昵 ?可 以 传递 一 个 比较 器 ，String 类 有 一 个 静态 成 员 
CASE_INSENSITIVE_ORDER， 它 就 是 一 个 忽略 大 小 写 的 Comparator 对 
象 ， 蔡 换 第 一 行 代码 为 : 





Map<String, String> map = new TreeMap<>(String.CASE_INSENSITIVE_ORDER ) ， 





输出 就 会 变 为 : 





a=abstract b=basic c=call T=tree 





正常 排序 是 从 小 到 大 ， 如 果 和 希望 逆序 呢 ? 可 以 传递 一 个 不 同 的 
Comparator 对 象 ， 第 一 行 代码 可 以 蔡 换 为 : 





Map<String, String> map = new TreeMap<>(new Comparator<String>(){ 
Q@Override 
public int compare(String o1, String 02) { 
return o2.compareTo(o1); 


}); 





这 样 ， 输 出 会 变 为 : 





c=call b=basic a=abstract T=tree 





为 什么 这 样 就 可 以 逆序 呢 ? 正常 排序 中 ，compare 方 法 内 是 
o1.compareTo (02) ， 两 个 对 象 翻 过 来 ， 自 然 束 是 逆序 了，Collections 
类 有 一 个 静态 方法 reverseOrder () 可 以 返回 一 个 逆序 比较 器 ， 也 就 是 
说 ， 上 面 的 代码 也 可 以 蔡 换 为 : 











Map<String, String> map = new TreeMap<>(Collections.reverseOrder()); 








如 琳 布 望 逆序 且 忽 略 大 小 写 呢 ?第 一 行 可 以 蔡 换 为 : 





Map<String, String> map = new TreeMap<>( 
Collections ,reverseorder(String,CASE_INSENSITIVE_ORDER ) ) ; 





需要 说 明 的 是 ，TreeMap 使 用 键 的 比较 结果 对 键 进行 排 重 ， 即 使 键 
实际 上 不 同 ， 但 只 要 比较 结果 相同 ， 它 们 就 会 被 认为 相同 ， 键 只 会 保存 
一 份 。 比 如 ， 如 下 代码 : 








Map<String, String> map = new TreeMap<>(String.CASE_INSENSITIVE_ORDER ) ， 

map.put("T", "tree"); 

map.put("t", "try"); 

for(Entry<String,String> kv : map.entrySet())t{ 
System.out.print(kv.getkey()+"="+kv.getValue()+" "); 

} 





看 上 去 有 两 个 不 同 的 键 "T" 和 "t"， 但 因为 比较 右 忽 上 略 大 小 写 ， 所 以 


只 会 有 一 个 ， 输 出 会 是 : 





T=try 





键 为 第 一 次 put 时 的 ， 这 里 即 "T"， 而 值 为 最 后 一 次 put 时 的 ， 这 里 
即 "try"。 


我 们 再 来 看 一 个 例子 ， 键 为 字符 串 形 式 的 日 期 ， 值 为 一 个 统计 数 
字 ， 和 希望 按照 日 期 输出 ， 代 码 为 : 





Map<String, Integer> map = new TreeMap<>(); 
map.put("2016-7-3", 100); 
map.put("2016-7-10", 120); 
map.put("2016-8-1", 90); 


for(Entry<String, Integer> kv : map.entrySet()){ 
System.out.printilin(kv.getkey()+","+kv.getVvalue()); 
} 





输出 为 : 





2016-7-10,120 
2016-7-3,100 
2016-8-1,90 





7 月 10 写 的 排 在 了 7 月 3 和 写 的 前 面 ， 与 期 望 的 不 符 ， 这 是 因为 ， 它 们 
是 按照 字符 串 比 较 的 ， 按 字符 串 ，2016-7-10 就 是 小 于 2016-7-3， 因 为 第 
一 个 不 同 之 处 1 小 于 3。 


怎么 解决 呢 ? 可 以 使 用 一 个 目 定 义 的 比较 器 ， 将 字符 串 转 换 为 日 
期 ， 按 日 期 进行 比较 ， 第 一 行 代码 可 以 改 为 : 








Map<String, Integer> map = new TreeMap<>(new Comparator<String>() { 
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd"); 
Q@Override 
public int compare(String o1, String 02) { 

try { 


return sdf.parse(o1).compareTo(sdf.parse(o2)); 
} catch (ParseException e) { 

e.printStackTrace(); 

return ©; 


} 
}); 





这 样 ， 输出 就 符合 期 望 了 ， 会 变 为 : 





2016-7-3,100 
2016-7-10,120 
2016-8-1,90 





以 上 就 是 TreeMap 的 基本 用 法 ， 与 HashMap 相 比 : 相同 的 是 ， 它 们 
都 实现 了 Map 接 口 ， 都 可 以 按 Map 进 行 操作 。 不 同 的 是 ， 迭 代 时 ， 
TreeMap 按 键 有 序 ， 为 了 实现 有 序 ， 它 要 求 要 么 键 实现 Comparable 接 
口 ， 要 么 创建 TreeMap 时 传递 一 个 Comparator 对 象 。 


由 于 TreeMap 按 键 有 序 ， 它 还 文 持 更 多 接口 和 方法 ， 具 体 来 说 ， 它 











还 实现 了 Sorted-Map 和 NavigableMap 接 口 ， 而 NavigableMap 接 口 扩展 了 
SortedMap， 通 过 这 两 个 接口 ， 可 以 方便 地 根据 键 的 顺序 进行 查找 ， 如 
第 一 个 、 最 后 一 个 、 某 一 范围 的 键 、 令 近 键 等 ， 限 于 篇 幅 ， 我 们 束 不 介 
绍 了 ， 具 体 可 参见 API 文 档 。 





10.4.2 ”实现 原理 


TreeMap 内 部 是 用 红 黑 树 实 现 的 ， 红 黑 树 是 一 种 大 致 平衡 的 排序 二 
又 树 ，10.3 节 我 们 介绍 了 排序 二 又 树 的 基本 概念 和 算法 ， 本 节 主 要 看 
TreeMap 的 一 些 代码 实现 (基于 Java 7) ， 先 来 看 TreeMap 的 内 部 组 成 。 
1. 内 部 组 成 


TreeMap 内 部 主要 有 如 下 成 员 : 








private final Comparator<? super K> comparator,; 
private transient Entry<K,V> root = null; 
private transient int size = 0; 











comparator 就 是 比较 器 ， 在 构造 方法 中 传递 ， 如 果 没 传 ， 束 是 null。 
size 为 当前 键 值 对 个 数 。root 指 回 树 的 根 节点 ， 从 根 节 点 可 以 访问 到 每 个 
节点 ， 节 点 的 类 型 为 Entry。Entry 是 TreeMap 的 一 个 内 部 类 ， 其 内 部 成 员 
和 构造 方法 为 : 





static final class Entry<K,V> implements Map .Entry<K,V> { 
K key; 
V value; 
Entry<K,V> left = null; 
Entry<K,V> right = null; 
Entry<K,V> parent,; 
boolean color = BLACK 
Entry(K key, V value, Entry<K,V> parent) { 
this.key = key; 
this.value = value; 
this.parent = parent,; 
} 
} 





每 个 节点 除了 键 (key) 和 值 (value) 之 外 ， 还 有 三 个 引用 ， 分 别 
指向 其 左 孩 子 (eft) 、 右 孩子 (right) 和 父 节 点 (parent) ， 对 于 根 节 
点 ， 父 节点 为 hull， 对 于 叶子 节点 ， 孩 子 节 点 都 为 nul， 还 有 一 个 成 员 





color 表 示 颜 色 ，TreeMap 是 用 红 黑 树 实现 的 ， 每 个 节点 都 有 一 个 颜色 ， 
非 党 即 红 。 


了 解 了 TreeMap 的 内 部 组 成 ， 我 们 来 看 一 些 主 要 方法 的 实现 代码 。 
2. 保 存 键 值 对 


put 方 法 的 代码 稍微 有 点 长 ， 我 们 分 段 来 看 。 先 看 第 一 段 ， 添 加 第 
一 个 节点 的 情况 : 





public V put(K key, V value) { 

Entry<K,V> t = root; 

if(t == null) { 
compare(key, key); // type (and possibly null) check 
root = new Entry<>(key, value, null); 
size = 1; 
modCount++; 
return null; 





当 添 加 第 一 个 节点 时 ，root 为 null， 执 行 的 就 是 这 段 代 码 ， 主 要 就 是 
新 建 一 个 节点 ， 设 置 root 指 向 它 ，size 设 置 为 1，modCount++ 的 含义 与 之 
前 章节 介绍 的 类 似 ， 用 于 迭代 过 程 中 检测 结构 性 变化 。 


令 人 费解 的 是 compare 调 用 ，compare (key, key) ; ，key 与 key 
比 ， 有 什么 意义 呢 ? 我们 看 compare 方 法 的 代码 : 





final int compare(Object ki1, Object k2) { 
return comparator==null ? ((Comparable<? super K>)k1).compareTo( (K)k2) 
: comparator.compare((K)k1i, (K)k2); 
} 








其 实 ， 这 里 的 目的 不 是 为 了 比较 ， 而 是 为 了 检查 key 的 类 型 和 null， 
如 果 类 型 不 匹配 或 为 null， 那 么 compare 方 法 会 抛 出 异常。 


如 果 不 是 第 一 次 添加 ， 会 执行 后 面 的 代码 ， 添 加 的 关键 步 又 是 寻找 
父 节 点 。 寻 找 父 节点 根据 是 否 设 置 了 comparator 分 为 两 种 情况 ， 我 们 先 
来 看 已 设置 的 情况 ， 代 码 为 : 





int cmp; 


Entry<K,V> parent ， 
//Split comparator and comparable paths 
Comparator<? Super K> cpr = comparator 
if(cpr != nul1) { 
do { 
parent = t; 
cmp = cpr.compare(key, t.key); 
if(cmp < 0) 
t = t.1left,; 
else if(cmp > 0) 
t = t.right; 
else 
return t.setValue(value); 
} while (t != null); 





寻找 是 一 个 从 根 节 点 开始 循环 的 过 程 ， 在 循环 中 ，cmp 保 存 比较 结 
果 ，t 指 同 当 前 比较 节点 ，parent 为 t 的 父 节 点 ， 循 环 结束 后 parent 就 是 要 
找 的 父 节 点 。t 一 开始 指 同 根 节 点 ， 从 根 节 点 开始 比较 键 ， 如 果 小 于 根 
节点 ， 就 将 t 设 为 左 孩 子 ， 与 左 孩 子 比较 ， 大 于 就 与 右 孩 子 比 较 ， 束 这 
样 一 直 比 ， 直 到 t 为 null 或 比较 结果 为 0。 如 果 比 较 结 果 为 0， 表 示 已 经 有 
这 个 键 了 ， 设 置 值 ， 然 后 返回 。 如 果 t 为 null， 则 当 退 出 循环 时 ，parent 
就 指 同 待 插入 节点 的 父 节 点 。 


我 们 再 来 看 没有 设置 comparator 的 情况 ， 代 码 为 : 














else { 
if(key == null) 
throw new NullPpointerException(); 
Comparable<? Super K> k = (Comparable<? Super K>) key 
do { 
parent = 七 
cmp = k.compareTo(t.key); 
if(cmp < 0) 
t = 七 Left， 
else if(cmp > 0) 
t = t.right; 
else 
return t.setValue(value); 
} while(t != null); 





基本 逻辑 是 一 样 的 ， 当 退出 循环 时 parent 指 癌 父 节点 ， 只 是 如 果 没 
有 设置 comparator， 则 假设 key 一 定 实现 了 Comparable 接 口 ， 使 用 
Comparable 接 口 的 compareTo 方 法 进行 比较 。 


找到 父 节 点 后 ， 就 是 新 建 一 个 节点 ， 根 据 新 的 键 与 父 节 点 键 的 比较 


结果 ， 插 入 作为 左 孩子 或 右 孩 子 ， 并 增加 size 和 modCount， 代 码 如 下 : 





Entry<K,V> e = new Entry<>(key, value, parent); 
if(cmp < 0) 
parent.left = e; 
else 
parent.right = e,; 
fixAfterIinsertion(e); 
SIZe++， 
modCount++; 





代码 大 部 分 都 容易 理解 ， 不 过 ， 里 面 有 一 行 重要 调用 
fixAfterInsertion Ce) ; ， 它 就 是 在 调整 树 的 结构 ， 使 之 符合 红 黑 树 的 
约束 ， 保 持 大 致 平衡 ， 其 代码 我 们 就 不 介绍 了 。 


稍微 总 结 一 下 ， 其 基本 思路 就 是 : 循环 比较 找到 父 节 点 ， 并 插入 作 
为 其 左 孩子 或 右 孩 子 ， 然 后 调整 保持 树 的 大 致 平衡 。 


3. 根 据 键 获取 值 
根据 键 获取 值 的 代码 为 : 








public V get(Object key) { 
Entry<K,V> p = getEntry(key); 
return(p==null ? null : p.value); 





就 是 根据 key 找 对 应 节点 p， 找 到 节点 后 获取 值 p.value， 来 看 
getEntry 的 代码 : 





final Entry<K,V> getEntry(Object key) { 
// Offload comparator-based version for sake of performance 
if(comparator != null) 
return getEntryUsingComparator(key); 
if(key == null) 
throw new NullPpointerException(); 
Comparable<? Super K> k = (Comparable<? Super K>) key 
Entry<K,V> p = root,; 
while(p != null) { 
int cmp = k.compareTo(p.key); 
if(cmp < 0) 
p = p.left; 
else if(cmp > 0) 
p = p.right; 
else 
return p; 


} 


return null; 


} 





如 果 comparator 不 为 空 ， 调 用 单独 的 方法 getEntryUsingComparator， 
人 否则， 假定 key 实 现 了 Comparable 接 口 ， 使 用 接口 的 compareTo 方 法 进行 
比较 ， 找 的 逻辑 也 很 简单 ， 从 根 开 始 找 ， 小 于 往 左边 找 ， 大 于 往 右 边 
找 ， 直 到 找到 为 上 上 ， 如 果 没 找到 ， 返 回 null。getEntry-UsingComparator 
方法 的 逻辑 类 似 ， 就 不 壮 述 了 。 


4. 碍 看 是 否 包含 某 个 值 


TreeMap 可 以 高 效 地 按键 进行 查找 ， 但 如 果 要 根据 值 进行 查找， 则 
需要 所 历 ， 我 们 来 看 代码 : 














public boolean containsVvalue(Object value) { 
for(Entry<K,V> e = getFirstEntry(); e != null; e = successor(e)) 
if(valEquals(value, e.value)) 
return true; 
return false; 


} 





主体 就 是 一 个 循环 遍历 ，getFirstEntry 方 法 返回 第 一 个 节点 ， 
successor 方 法 返回 给 定 节点 的 后 继 节 点 ，valEquals 束 是 比较 值 ， 从 第 一 
个 节点 开始 ， 逐 个 进行 比较 ， 直 到 找到 为 止 ， 如 果 循 环 结束 也 没 找到 则 
返回 false。 getFirstEntry 的 代码 为 : 





final Entry<K,V> getFirstEntry() { 
Entry<K,V> p = root,; 
if(p != null) 
while (p.left != null) 
p = p.left; 
return p; 


} 








代码 很 简单 ， 第 一 个 节操 就 是 最 左边 的 市 反 。 


10.3 节 我 们 介绍 过 找 后 继 节 点 的 算法 ，successor 的 具体 代码 为 : 





static <K,V> TreeMap.Entry<K,V> successor(Entry<K,V> t) { 
if(t == null) 
return null; 


else if(t,right != null) { 
Entry<K,V> p = t.right,; 
while (p.left != null) 
p = p.left; 
return p; 
} else { 
Entry<K,V> p = t.parent; 
Entry<K,V> ch = t; 
while(p != null && ch == p.right) { 
ch = p; 
p = p.parent; 


return p; 
} 
} 





如 10.3 节 后 继 算法 所 述 ， 有 两 种 情况 : 

1) 如 果 有 右 孩 子 (tright! =nul) ， 则 后 继 节 点 为 右 子 树 中 最 小 的 

2) 如 果 没 有 右 孩 子 ， 后 继 节点 为 某 祖 先 节点 ， 从 当前 节点 往 上 
找 ， 如 果 它 是 父 节点 的 右 孩 子 ， 则 继续 找 父 节点 ， 直 到 它 不 是 右 孩 子 或 
父 节 点 为 空 ， 第 一 个 非 右 孩 子 节 点 的 父亲 节点 就 是 后 继 节 点 ， 如 果 父 节 
点 为 空 ， 则 后 继 节 点 为 null。 


代码 与 算法 是 对 应 的 ， 就 不 再 袭 述 了 ， 这 个 描述 比较 抽象 ， 可 以 参 
考 图 10-7， 进 行 对 照 。 


5. 根 据 键 删除 键 值 对 
根据 键 删除 键 值 对 的 代码 为 : 








public V remove(Object key) { 
Entry<K,V> p = getEntry(key); 
if(p == null) 
return null; 
V oldValue = p.value; 
deleteEntry(p); 
return oldValue; 





根据 key 找 到 节点 ， 调 用 deleteEntry 删 除 节 点 ， 然 后 返回 原来 的 值 。 
10.3 节 介绍 过 节点 删除 的 算法 ， 市 占有 三 种 情况 : 





1) 叶子 节点 ， 这 个 容易 处 理 ， 直 接 修改 父 节点 对 应 引用 置 null 即 
可 。 





2) 只 有 一 个 孩子 ， 就 是 在 父 杀 节 点 和 和 孩子 节点 直接 建立 链接 。 

3) 有 两 个 孩子 : 先 找 到 后 继 节 后 ， 找 到 后 ， 蔡 换 当 前 节操 的 内 容 
为 后 继 节 点 ， 然 后 再 删除 后 继 和 节点， 因为 这 个 后 继 节 点 一 定 没 有 磊 孩 
子 ， 所 以 束 将 两 个 孩子 的 情况 转换 为 了 前 面 两 种 情况 。 


deleteEntry 的 具体 代码 也 稍微 有 点 长 ， 我 们 分 段 来 看 : 








private void deleteEntry(Entry<K,V> p) { 
modCount++; 
Size--; 
//If strictly internal, copy successor's element to p and then make pp 
//point to successor. 
if(p.left != null && p.right != null) { 
Entry<K,V> s = successor(p); 
p.key = s.key; 
p.value = s.value; 


p= 5S, 
} //p has 2 children 





这 里 处 理 的 束 是 两 个 孩子 的 情况 ，s 为 后 继 ， 当 前 节点 p 的 key 和 
value 设 置 为 了 s 的 key 和 value， 然 后 将 待 删节 点 p 指 癌 了 s， 这 样 就 转换 为 
了 一 个 孩子 或 叶子 节点 的 情况 。 


再 往 下 看 一 个 孩子 情况 的 代码 : 





//Start fixup at replacement node, if it exists. 
Entry<K,V> replacement = (p.left != null ? p.left : p.right)， 
if(replacement != null) { 
//Link replacement to parent 
replacement parent = p.parent; 
if(p.parent == null) 
root = replacement; 
else if(p == p.parent.1left) 
p.parent.left = replacement,; 
else 
p.parent.right = replacement,; 
// Null out links so they are OK to use by fixAfterDeletion. 
p.left = p.right = p.parent = null; 
// Fix replacement 
if(p.color == BLACK) 
fixAfterDeletion(replacement); 
} else if (p.parent == null) { // return if we are the only node. 


t= 


p 为 竺 删节 点 ，replacement 为 要 蔡 换 p 的 孩子 节点 ， 主 体 代 人 码 驶 是 在 
p 的 父 节 点 p.parent 和 replacement 之 间 建 立 链接 ， 以 蔡 换 p.parent 和 p 原 来 
的 链接 ， 如 果 p.parent 为 null， 则 修改 root 以 指 癌 新 的 根 。fixAfterDeletion 
重新 平衡 树 。 


最 后 来 看 叶子 节点 的 情况 : 








} else if(p.parent == null) { // return if we are the only node. 
root = null; 
} else { // No children. Use self as phantom replacement and unlink. 
if(p.color == BLACK) 
fixAfterDeletion(p); 
if(p.parent != null) { 
if(p == p.parent.1eft) 
p.parent.1left = null; 
else if(p == p.parent.right) 
p.parent.right = null; 
p.parent = null; 





再 具体 分 为 两 种 情况 : 一 种 是 删除 最 后 一 个 节点 ， 修 改 root 为 null; 
ee 相应 的 设置 孩子 
节点 为 null。 


以 上 束 是 TreeMap 的 基本 实现 原理 ， 与 10.3 节 介绍 的 排序 二 又 树 的 
基本 概念 和 算法 是 一 臻 的， 只 是 TreeMap 用 了 红 黑 树 。 








10.4.3 站 结 


本 节 介 绍 了 TreeMap 的 用 法 和 实现 原理 ， 与 HashMap 相 比 ， 
TreeMap 同 样 实现 了 Map 接 口 ， 但 内 部 使 用 红 黑 树 实 现 。 红 黑 树 是 统计 
效率 比较 高 的 大 致 平衡 的 排序 二 叉 树 ， 这 决定 了 它 有 如 下 特点 : 


1) 按键 有 序 ，TreeMap 同 样 实 现 了 SortedMap 和 NavigableMap 接 
口 ， 可 以 方便 地 根据 键 的 顺序 进行 查找， 如 第 一 个 、 最 后 一 个 、 某 一 范 
围 的 键 、 邻 近 键 等 。 


2) 为 了 按键 有 序 ，TreeMap 要 求 刍 实现 Comparable 接 口 或 通过 构造 
方法 提供 一 个 Com-parator 对 象 。 














3) 根据 键 保 存 、 碍 找 、 删 除 的 效率 比较 高 ， 为 O Ch) ，h 为 树 的 
高 度 ， 在 树 平衡 的 情况 下 ，h 为 log。 (N) ，N 为 节点 数 。 


应 该 用 HashMap 还 是 TreeMap 呢 ? 不 要 求 排序 ， 优 先 考 虑 
HashMap， 要 求 排序 ， 考 虑 TreeMap。HashMap 有 对 应 的 TreeMap， 
HashSet 也 有 对 应 的 TreeSet， 下 节 ， 我 们 来 看 TreeSet。 


10.5 训 析 TreeSet 





在 介绍 HashSet 时 ， 我 们 提 到 ，HashSet 有 一 个 重要 局 限 ， 元 素 之 间 
没有 特定 的 顺序 ， 我 们 还 提 到 ，Set 接 口 还 有 另 一 个 重要 的 实现 类 
TreeSet， 它 是 有 序 的 ， 与 HashSet 和 HashMap 的 关系 一 样 ，TreeSet 是 基 
于 TreeMap 的 ， 本 节 我 们 来 详细 讨论 TreeSet。 下 面 ， 我 们 先 介 绍 TreeSet 
的 用 法 ， 然 后 介绍 实现 原理 ， 最 后 总 结 分 析 TreeSet 的 特点 。 





10.5.1 基本 用 法 





TreeSet 的 基本 构造 方法 有 两 个 : 





public TreeSet() 
public TreeSet(Comparator<? Super E> comparator) 





第 一 个 是 默认 构造 方法 ， 假 定 元 素 实 现 了 Comparable 接 口 ; 第 二 个 
使 用 传 入 的 比较 器 ， 不 要 求 元 素 实现 Comparable。TreeSet 经 常 也 只 是 当 
作 Set 使 用 ， 只 是 希望 从 代 输出 有 序 ， 如 下 面 代码 所 示 : 











Set<String> words = new TreeSet<String>()， 
words.addAll(Arrays.asList(new String[]{ 
"tree", "map", "hash", "map", 


/ 
for(String w : words){ 
System.out.print(w+" "); 


} 





输出 为 : 





hash map tree 





TreeSet 实 现 了 两 点 : 排 重 和 有 序 。 如 果 和 希望 不 同 的 排序 ， 可 以 传 
递 一 个 Comparator， 比 如 : 





Set<String> words = new TreeSet<String>(new Comparator<String>(){ 


Q@Override 
public int compare(String o1, String 02) { 
return o1.compareToIgnoreCase(o2); 


}}); 

words.addAll(Arrays.asList(new String[]{ 
"tree", "map", "hash", "Map", 

})); 


System.out.println(words); 





忽略 大 小 写 进 行 比较 ， 输 出 为 : 





[hash，map，tree] 








需要 注意 的 是 ，Set 是 排 重 的 ， 排 重 是 基于 比较 结果 的 ， 结 果 为 0 即 
2 "map" 和 "Map" 虽 然 不 同 ， 但 比较 结果 为 0， 所 以 只 会 保留 第 
一 小 元 系 。 


以 上 就 是 TreeSet 的 基本 用 法 ， 简 单 易 用 。 因 为 有 序 ，TreeSet 还 实 
现 了 NavigableSet 和 SortedSet 接 口 ，NavigableSet 扩 展 了 SortedSet， 可 以 
方便 地 根据 顺序 进行 查找 和 操作 ， 如 第 一 个 、 最 后 一 个 、 某 一 取 值 苑 
围 ， 限于 篇 幅 ， 我 们 就 不 介绍 了 ， 具 体 可 参见 
API 文 档 。 








10.5.2 ”实现 原理 


之 前 章节 介绍 过 ，HashSet 是 基于 HashMap 实 现 的 ， 元 素 束 是 
HashMap 中 的 键 ， 值 是 一 个 固定 的 值 ，TreeSet 是 类 似 的 ， 它 是 基于 
TreeMap 实 现 的 。 我 们 具体 来 看 一 下 代码 ， 先 看 其 内 部 组 成 。 


TreeSet 的 内 部 有 如 下 成 员 : 





private transient NavigableMap<E,Object> m; 
private static final Object PRESENT = new Object(); 





m 就 是 背后 的 那个 TreeMap， 这 里 用 的 是 更 为 通用 的 接口 类 型 
NavigableMap，PRESENT 就 是 那个 固定 的 共享 值 。TreeSet 的 方法 实现 
主要 就 是 调用 m 的 方法 ， 我 们 具体 来 看 下 。 


默认 构造 方法 的 代码 为 : 





TreeSet(NavigableMap<E, Object> m) { 
this.m = m; 


} 
public TreeSet() { 
this(new TreeMap<E, Object>()); 





代码 都 比较 简单 ， 就 不 解释 了 。 添 加 元 素 ，add 方 法 的 代码 为 : 





public boolean add(E e) { 
return m.put(e, PRESENT)==null; 
} 





就 是 调用 map 的 put 方 法 ， 元 素 e 用 作 键 ， 值 就 是 固定 值 PRESENT， 
put 返 回 null 表 示 原 来 没有 对 应 的 键 ， 添 加 成 功 了 。 检 查 是 否 包含 元 素 ， 
代码 为 : 

















public boolean contains(Object o) { 
return m.containskey(o); 








就 是 检查 map 中 是 售 包 合 对 应 的 键 。 删 除 元 系 ， 代 码 为 : 





public boolean remove(Object o) { 
return m.remove(o)==PRESENT; 


} 





就 是 调用 map 的 remove 方 法 ， 返 回 值 为 PRESENT 表 示 原 来 有 对 应 的 
键 且 删除 成 功 了 。 


TreeSet 的 实现 代码 都 比较 简单 ， 主 要 就 是 调用 内 部 NavigatableMap 
的 方法 。 


10.5.3 ”小 结 


本 节 介 绍 了 TreeSet 的 用 法 和 实现 原理 ， 在 用 法 方面 ， 它 实现 了 Set 





接口 ， 但 有 序 ， 在 内 部 实现 上 ， 它 基于 TreeMap 实 现 ， 而 TreeMap 基 于 
大 致 平衡 的 排序 二 叉 树 : 红 黑 树 ， 这 决定 了 它 有 如 下 特点 。 

1) 没有 重复 元 素 。 

2) 添加 、 删 除 元 素 、 判 断 元 素 是 否 存 在 ， 效 紊 比较 高 ， 为 O(log， 
(N) ) ，N 为 元 素 个 数 。 


3) 有 序 ，TreeSet 同 样 实现 了 SortedSet 和 NavigatableSet 接 口 ， 可 以 
方便 地 根据 顺序 进行 查找 和 操作 ， 如 第 一 个 、 最 后 一 个 、 某 一 取 值 范 
围 、 某 一 值 的 邻近 元 素 等 。 


4) 为 了 有 序 ，TreeSet 要 求 元 素 实 现 Comparable 接 口 或 通过 构造 方 
法 提供 一 个 Com-parator 对 象 。 











10.6 ”剖析 LinkedHashMap 


前 面 我 们 介绍 了 Map 接 口 的 两 个 实现 类 HashMap 和 TreeMap， 本 市 
介绍 另 一 个 实现 类 LinkedHashMap。 它 是 HashMap 的 子 类 ， 但 可 以 保持 
元 素 按 插入 或 访问 有 序 ， 这 与 TreeMap 按 键 排序 不 同 。 按 插入 有 序 容易 
理解 ， 按 访问 有 序 是 什么 意思 呢 ?” 这 两 个 有 序 有 什么 用 呢 ? 内 部 是 怎么 
实现 的 ?本 市 就 来 探讨 这 些 问 题 ， 从 用 法 开始 。 








10.6.1 基本 用 法 


LinkedHashMap 是 HashMap 的 子 类 ， 但 内 部 还 有 一 个 双 同 链表 维护 
键 值 对 的 顺序 ， 每 个 键 值 对 既 位 于 哈 希 表 中 ， 也 位 于 这 个 双 同 链表 中 。 
LinkedHashMap 文 持 两 种 顺序 : 一 种 是 插入 顺序 ， 男 外 一 种 是 访问 顺 
邮 s 





插入 顺序 容易 理解 ， 先 添加 的 在 前 面 ， 后 添加 的 在 后 面 ， 修 改 操 作 
不 影响 顺序 。 访 问 顺序 是 什么 意思 呢 ? 所 谓 访 问 是 指 get/put 操 作 ， 对 一 
个 键 执行 get/put 操 作 后 ， 其 对 应 的 键 值 对 会 移 到 链表 末尾 ， 所 以 ， 最 末 
J 问 的 ， 最 开始 的 最 久 没 被 访问 的 ， 这 种 顺序 就 是 访问 顺 
了 。 


LinkedHashMap 有 5 个 构造 方法 ， 其 中 4 个 都 是 按 插入 顺序 ， 只 有 一 
个 构造 方法 可 以 指定 按 访 问 顺序 ， 如 下 所 示 : 








public LinkedHashMap(int initialCapacity, float loadFactor, 
boolean accessorder) 








其 中 参数 accessOrder 就 是 用 来 指定 是 否 按 访问 顺序 ， 如 果 为 true， 
就 是 访问 顺序 。 


默认 情况 下 ，LinkedHashMap 是 按 插 入 有 序 的 ， 我 们 看 个 例子 : 








Map<String,Integer> seqMap = new LinkedHashMap<>(); 
seqMap.put("c", 100); 
seqMap.put("d", 200); 


seqMap.put("a", 500); 

seqMap.put("d", 300); 

for(Entry<String,Integer> entry : seqMap.entrySet()){ 
System.out.printlin(entry.getkey()+" "+entry.getValue()); 

} 





键 是 按照 "ce"、"d"、"a" 的 顺序 插 入 的 ， 修 改 "d" 的 值 不 会 修改 顺序 ， 
所 以 输出 为 : 





C 100 
d 300 
a 500 





什么 时 候 和 希望 保持 插入 顺序 呢 ? 


Map 经 常用 来 处 理 一 些 数 据 ， 其 处 理 模 式 是 : 接收 一 些 键 值 对 作为 
输入 ， 处 理 ， 然 后 输出 ， 输 出 时 和 希望 保持 原来 的 顺序 。 比 如 一 个 配置 文 
件 ， 其 中 有 一 些 键 值 对 形式 的 配置 项 ， 但 其 中 有 一 些 键 是 重复 的 ， 和 希望 
保留 最 后 一 个 值 ， 但 还 是 按 原 来 的 键 顺 序 输出 ，LinkedHashMap 就 是 一 
个 合适 的 数据 结构 。 


再 如 ， 和 希望 的 数据 模型 可 能 就 是 一 个 Map， 但 希望 保持 添加 的 顺 
人 
采 存 。 


另外 一 种 常见 的 场景 是 : 希望 Map 能 够 按键 有 序 ， 但 在 添加 到 Map 
前 ， 键 已 经 通过 其 他 方式 排 好 序 了 ， 这 时 ， 束 没有 必要 使 用 TreeMap 
了 ， 些 竟 TreeMap 的 开销 要 大 一 些 。 比 如 ， 在 从 数据 库 查询 数据 放 到 内 
存 时 ， 可 以 使 用 SQL 的 order by 语句 让 数据 库 对 数据 排序 。 


我 们 来 看 按 访 问 有 序 的 例子 ， 代 码 如 下 : 




















Map<String, Integer> accessMap = new LinkedHashMap<>(16, 0.75f, true); 

accessMap.put("c", 100); 

accessMap.put("d", 200); 

accessMap.put("a", 500); 

accessMap.get("c"); 

accessMap.put("d", 300); 

for(Entry<String,Integer> entry : accessMap.entrySet()){ 
System.out.printlin(entry.getkey()+" "+entry.getValue()); 

} 


= 


每 次 访问 都 会 将 该 键 值 对 移 到 末尾 ， 所 以 输出 为 : 





a 500 
C 100 
d 300 





什么 时 候 希 望 按 访问 有 序 呢 ? 一 种 典型 的 应 用 是 LRU 缓 存 ， 它 是 什 
么 昵 ? 


绥 存 是 计算 机 技术 中 一 种 非常 有 用 的 技术 ， 古 一 个 通用 的 提升 数据 
访问 性 能 的 思路 ， 一 般 用 来 保存 常用 的 数据 ， 容 量 较 小 ， 但 访问 更 快 。 
绥 存 是 相对 主 存 而 言 的 ， 主 存 的 容量 更 大 ， 但 访问 更 慢 。 绥 存 的 基本 假 
设 是 : 数据 会 被 多 次 访问 ， 一 般 访 问 数据 时 都 先 从 绥 存 中 找 ， 绥 存 中 没 
人 找到 后 再 放 入 缓存 ， 这 样 下 次 如 宁 再 找 相 同 数据 访问 
就 快 了 。 


绥 存 用 于 计算 机 技术 的 各 个 领域 ， 比 如 CPU 里 有 缓存 ， 有 一 级 组 
存 、 二 级 缓存 、 三 级 缓存 等 ， 一 级 缓存 非常 小 、 非 党 贯 、 也 非常 快 ， 三 
级 缓存 则 大 一 些 、 便 宜 一 些 、 也 慢 一 些 ，CPU 绥 存 是 相对 于 内 存 而 言 
的 ， 它 们 都 比 内 存 快 。 内 存 里 也 有 缓存 ， 内 存 的 缓存 一 般 是 相对 于 人 硬盘 
数据 而 言 的 。 硬 盘 也 可 能 是 缓存， 缓存 网 络 上 其 他 机 器 的 数据 ， 比 如 浏 
览 需 访 问 网 页 时 ， 会 把 一 些 网 页 缓存 到 本 地 硬盘 。 


LinkedHashMap 可 以 用 于 缓存 ， 比 如 缓存 用 户 基 本 信息 ， 键 是 用 户 
Id， 值 是 用 户 信 息 ， 所 有 用 户 的 信息 可 能 保存 在 数据 库 中 ， 部 分 活跃 用 
户 的 信息 可 能 保存 在 缓存 中 。 


一 般 而 言 ， 绥 存 容量 有 限 ， 不 能 无 限 存储 所 有 数据 ， 如 果 绥 存 满 
了 ， 当 需要 存储 新 数据 时 ， 残 需要 一 定 的 策略 将 一 些 老 的 数据 清理 出 
去 ， 这 个 策略 一 般 称 为 替换 算法 。LRU 是 一 种 流行 的 替换 算法 ， 它 的 全 
称 是 Least Recently Used， 即 最 近 最 少 使 用 。 它 的 思路 是 ， 最 近 刚 被 使 
用 的 很 快 再 次 被 用 的 可 能 性 最 高 ， 而 最 久 没 被 访问 的 很 快 再 次 被 用 的 可 
能 性 最 低 ， 所 以 被 优先 清理 。 

使 用 LinkedHashMap， 可 以 非常 容易 地 实现 LRU 缓 存 ， 默 认 情 况 


下 ，LinkedHashMap 没 有 对 容量 做 限制 ， 但 它 可 以 容易 地 做 到 ， 它 有 一 
个 protected 方 法 ， 如 下 所 示 : 



































protected boolean removeEldestEntry(Map.Entry<K,V> eldest) { 
return false; 





在 添加 元 素 到 LinkedHashMap 后 ，LinkedHashMap 会 调用 这 个 方 
法 ， 传 递 的 参数 是 最 和 久 没 被 访问 的 键 值 对 ， 如 果 这 个 方法 返回 true， 则 
这 个 最 和 久 的 键 值 对 就 会 被 删除 。Linked-HashMap 的 实现 总 是 返回 false， 
a 
返回 true。 





制 ， 这 个 限制 在 构造 方法 中 传递 。 
代码 清单 10-4 LRU 缓 存 





public class LRUCache<K，V> extends LinkedHashMap<K，V> { 
private int maxEntries' 
public LRUCache(int maxEntries){ 
super(16, 0.75f, true); 
this.maxEntries = maxEntries,; 


Q@Override 
protected boolean removeEldestEntry(Entry<K, V> eldest) { 
return size() > maxEntries; 





这 个 缓存 可 以 这 么 用 : 





LRUCache<String,Object> cache = new LRUCache<>(3); 
cache.put("a", "abstract"),; 

cache.put("b", "basic"); 

cache.put("c", "call"); 

cache.get("a"); 

cache.put("d", "call"); 

System,out.println(cache ) ， 





限定 缓存 容量 为 3， 先 后 添加 了 4 个 键 值 对 ， 最 久 没 被 访问 的 键 
是 "b"， 会 被 删除 ， 所 以 输出 为 : 





{c=call, a=abstract, d=call} 





10.6.2 ”实现 原理 


理解 了 LinkedHashMap 的 用 法 ， 下 面 我 们 来 看 其 实现 代码 〈 基 于 
Java7) 。 先 来 看 内 部 组 成 ， 再 看 一 些 主要 方法 的 实现 。 
LinkedHashMap 是 HashMap 的 子 类 ， 内 部 增加 了 如 下 实例 变量 : 








private transient Entry<K,V> header ; 
private final boolean accessOrder; 








accessOrder 表 示 是 按 访 问 顺序 还 是 插入 顺序 。header 表 示 双 同 链表 
的 涉 ， 它 的 类 型 Entry 是 一 个 内 部 类 ， 这 个 类 是 HashMap.Entry 的 子 类 ， 
增加 了 两 个 变量 before 和 after， 指 向 链表 中 的 前 驱 和 后 继 ，Entry 的 完整 
定义 如 代码 清单 10-5 所 示 。 


代码 清单 10-5 “LinkedHashMap 中 的 Entry 








private static class Entry<K,V> extends HashMap .Entry<K,V> { 
Entry<K,V> before, after,; 
Entry(int hash, K key, V value, HashMap.Entry<K,V> next) { 
super(hash, key, value, next); 


private void remove() { 
before.after = after ， 
after.before = before; 
} 
private void addBefore(Entry<K,V> existingEntry) { 
after = existingEntry; 
before = existingEntry.before; 
before.after = this,; 
after.before = this; 


void recordAccess(HashMap<K,V> m) { 
LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m; 
if(lm.accessOrder) { 
lm.modCount++; 
remove( ); 
addBefore(1lm.header); 


} 


void recordRemoval(HashMap<K,V> m) { 
remove( ); 





recordAccess 和 recordRemoval 是 HashMap.Entry 中 定义 的 方法 ， 在 
HashMap 中 ， 这 两 个 方法 的 实现 为 空 ， 它 们 束 是 被 设计 用 来 被 子 类 重 写 





的 。 在 put 被 调用 且 键 存在 时 ，HashMap 会 调用 Entry 的 recordAccess 方 
法 ; 在 键 被 删除 时 ，HashMap 会 调用 Entry 的 recordRemoval 方 法 。 


LinkedHashMap.Entry 重 写 了 这 两 个 方法 。 在 recordAccess 方 法 中 ， 
如 果 是 按 访 问 顺序 的 ， 则 将 该 节点 移 到 链表 的 末尾 ;在 recordRemoval 方 
法 中 ， 将 该 节点 从 链表 中 移 除 。 


了 解 了 内 部 组 成 ， 我 们 来 看 操作 方法 ， 先 看 构造 方法 。 
在 HashMap 的 构造 方法 中 ， 会 调用 init 方 法 ，init 方 法 在 HashMap 的 


实现 中 为 空 ， 也 是 被 设计 用 来 被 重 写 的 。LinkedHashMap 重 写 了 该 方 
法 ， 用 于 初始 化 链表 的 头 节 点 ， 代 码 如 下 : 





void init() { 
header = new Entry<>(-1, null, null, null); 
header .before = header.after = header; 


} 





header 被 初始 化 为 一 个 Entry 对 象 ， 前 驱 和 后 继 都 指 问 自己 ， 如 图 
10-12 所 示 。 


header 


before | 一 下 
= 


图 10-12 ”LinkedHashMap 初 始 内 存 结构 








header.after 指 向 第 一 个 节点 ，header.before 指 向 最 后 一 个 节点 ， 指 
向 header 表 示 链 表 为 空 。 


在 LinkedHashMap 中 ，pnut 方 法 还 会 将 节点 加 入 到 链表 中 来 ， 如 果 是 


按 访 问 有 序 的 ， 还 会 调整 节点 到 末尾 ， 并 根据 情况 删除 最 久 没 被 访问 的 
HashMap 的 put 实 现 中 ， 如 果 是 新 的 键 ， 会 调用 addEntry 方 法 添加 节 
点 ，LinkedHash-Map 重 写 了 该 方法 ， 代 人 码 为 : 





void addEntry(int hash，K key, V value, int bucketIndex) { 
super.addEntry(hash, key, value, bucketIindex); 
//Remove eldest entry if instructed 
Entry<K,V> eldest = header.after,; 
if(removeEldestEntry(eldest)) { 
removeEntryForKey(eldest .key); 





它 先 调用 父 类 的 addEntry 方 法 ， 父 类 的 addEntry 会 调用 createEntry 创 
建 节点 ，Linked-HashMap 重 写 了 createEntry， 代 码 为 : 





void createEntry(int hash, K key, V value, int bucketIndex) { 
HashMap.Entry<K,V> old = table[bucketIndex]; 
Entry<K,V> e = new Entry<>(hash, key, value, o1d); 
table[bucketIndex] = e; 
e.addBefore(header); 
SIZe++， 





新 建 节 点， 加 入 哈 希 表 中 ， 同 时 加 入 链表 中 ， 加 到 链表 末尾 的 代码 


日 
AE: 





e.addBefore(header) 





比如 ， 执 行 如 下 代码 : 





Map<String,Integer> countMap = new LinkedHashMap<>(); 
countMap.put("hello", 1); 





执行 后 ， 内 存 结 构 如 图 10-13 所 示 。 












next | null 
hash |96207088 





图 10-13 ”LinkedHashMap 插 入 一 个 元 素 后 的 内 存 结构 


添加 完 后 ， 调 用 removeEldestEntry 检 查 是 否 应 该 删除 老 节 点 ， 如 果 
返回 值 为 tue， 则 调用 removeEntryForKey 进 行 删 除 ，remove- 


EntryForKey 是 HashMap 中 定义 的 方法 ， 删 除 节 点 时 会 调用 
HashMap.Entry 的 record-Removal 方 法 ， 该 方法 被 LinkedHashMap.Entry 重 
写 了 ， 会 将 节点 从 链表 中 删除 。 

在 HashMap 的 put 实 现 中 ， 如 果 键 已 经 存在 了 ， 则 会 调用 节点 的 
recordAccess 方 法 。LinkedHashMap.Entry 重 写 了 该 方法 ， 如 果 是 按 访问 
有 序 ， 则 调整 该 节点 到 链表 末尾 。 


LinkedHashMap 重 写 了 get 方 法 ， 代 人 码 为 : 











public V get(Object key) { 
Entry<K,V> e = (Entry<K,V>)getEntry(key); 
if(e == null) 
return null; 
e.recordAccess(this),; 
return e.value; 


} 





与 HashMap 的 get 方 法 的 区 别 ， 主 要 是 调用 了 市 点 的 recordAccess 方 
法 ， 如 果 是 按 访 问 有 序 ，recordAccess 调 整 该 节点 到 链表 末尾 。 


查看 HashMap 中 是 否 包 含 某 个 值 需要 进行 裔 历 ， 由 于 
LinkedHashMap 维 护 了 单独 的 链表 ， 它 可 以 使 用 链表 进行 更 为 高 效 的 过 
历 ， 具 体 代 码 比较 简单 ， 我 们 就 不 列举 了 。 


以 上 就 是 LinkedHashMap 的 基本 实现 原理 ， 它 是 HashMap 的 子 类 ， 
它 的 节点 类 LinkedHashMap.Entry 是 HashMap.Entry 的 子 类 ， 
LinkedHashMap 内 部 维护 了 一 个 单独 的 双 同 链表 ， 每 个 节点 即位 于 哈 希 
表 中 ， 也 位 于 双 同 链表 中 ， 在 链表 中 的 顺序 默认 是 插入 顺序 ， 也 可 以 配 
置 为 访问 顺序 ，LinkedHashMap 及 其 节点 类 LinkedHashMap.Entry 重 写 了 
右 干 方法 以 维护 这 种 关系 。 














10.6.3 LinkedHashSet 








之 前 介绍 的 Map 接 口 的 实现 类 都 有 一 个 对 应 的 Set 接 口 的 实现 类 ， 比 
如 HashMap 有 HashSet，TreeMap 有 TreeSet，LinkedHashMap 也 不 例外 ， 
它 也 有 一 个 对 应 的 Set 接 口 的 实现 类 LinkedHashSet。LinkedHashSet 是 
HashSet 的 子 类 ， 它 内 部 的 Map 的 实现 类 是 LinkedHashMap， 所 以 它 也 可 





以 保持 插入 顺序 ， 比 如 : 





Set<String> set = new LinkedHashSet<>(); 
set.add("b"); 

set.add("c"); 

set.add("a"); 

set.add("c"); 

System,.out.println(set); 





输出 为 : 





[b, c, al] 





LinkedHashSet 的 实现 比较 简单 ， 我 们 就 不 再 介绍 了 。 
10.6.4 小结 


本 节 主 要 介绍 了 LinkedHashMap 的 用 法 和 实现 原理 ， 用 法 上 ， 它 可 
以 保持 插入 顺序 或 访问 顺序 。 插 入 顺序 经 常用 于 处 理 键 值 对 的 数据 ， 并 
保持 其 输入 顺序 ， 也 经 常用 于 键 已 经 排 好 序 的 场景 ， 相 比 TreeMap 效 率 
更 高 ; 访问 顺序 经 常用 于 实现 LRU 绥 存 。 实 现 原理 上 ， 它 是 HashMap 的 
子 类 ， 但 内 部 有 一 个 双 同 链表 以 维护 节点 的 顺序 。 最 后 ， 我 们 简单 介绍 
了 LinkedHashSet， 它 是 HashSet 的 子 类 ， 但 内 部 使 用 LinkedHashMap。 











10.7 ”剖析 EnumMap 


如 果 需 要 一 个 Map 的 实现 类 ， 并 且 键 的 类 型 为 枚 举 类 型 ， 可 以 使 用 
HashMap， 但 应 该 使 用 一 个 专门 的 实现 类 EnumMap。 为 什么 要 有 一 个 专 
门 的 类 呢 ? 我 们 之 前 介绍 过 枚 举 的 本 质 ， 主 要 是 因为 枚 举 类 型 有 两 个 特 
征 : 一 是 它 可 能 的 值 是 有 限 的 且 预 先 定义 的 ;二 是 枚 举 值 都 有 一 个 顺 
序 ， 这 两 个 特征 使 得 可 以 更 为 高 效 地 实现 Map 接 口 。 我 们 先 来 看 
EnumMap 的 用 法 ， 然 后 看 它 到 底 是 怎么 实现 的 。 





10.7.1 基本 用 法 


举 个 简单 的 例子 。 比 如 ， 有 一 批 关 于 衣服 的 记录 ， 我 们 希望 按 尺 寸 
统计 衣服 的 数量 。 定 义 一 个 简单 的 枚 举 类 Size， 表 示 衣 服 的 尺寸 : 





public enum Size { 
SMALL, MEDIUM, LARGE 
} 





定义 一 个 简单 类 Clothes， 表 示 衣 服 : 





class Clothes { 
String id; 
Size size; 
// 省 略 getter/setter 和 构造 方法 





} 





有 一 个 表示 衣服 记录 的 列表 List<Clothes>， 我 们 希望 按 尺 寸 统 计数 
量 ， 统 计 方 法 可 以 为 : 





public static Map<Size, Integer> countBySize(List<Clothes> clothes)t{ 
Map<Size, Integer> map = new EnumMap<>(Size.class); 
for(Clothes c : clothes){ 
Size size = c.getSize(); 
Integer count = map.get(size); 
if(count!=null)t{ 
map.put(size, count+1); 
}elsef{ 
map.put(size, 1); 


return map 


} 





0 
小: 





Map<Size, Integer> map = new EnumMap<>(Size.class); 





与 HashMap 不 同 ， 它 需要 传递 一 个 类 型 信息 ，Size.class 表 示 枚 举 类 
Size 的 运行 时 类 型 信息 ，Size.class 也 是 一 个 对 象 ， 它 的 类 型 是 Class。 为 
什么 需要 这 个 参数 呢 ? 没有 这 个 ，EnumMap 就 不 知道 具体 的 枚 举 类 是 
什么 ， 也 无 法 初始 化 内 部 的 数据 结构 。 


使 用 以 上 的 统计 方法 也 是 很 简单 的 ， 比 如 : 





List<Clothes> clothes = Arrays.asList(new Clothes[]{ 
new Clothes("C001",Size.SMALL), new Clothes("cC002", Size.LARGE), 
new Clothes("C003", Size.LARGE), new Clothes("C004", Size.MEDIUM), 
new Clothes("C0O05", Size.SMALL), new Clothes("C006", Size.SMALL), 


}); 
System,.out.println(countBySize(clothes)); 





输出 为 : 





{SMALL=3, MEDIUM=1, LARGE=2} 





需要 说 明 的 是 ， 与 HashMap 不 同 ，EnumMap 是 保证 顺序 的 ， 输 出 是 
按照 键 在 枚 举 中 的 顺序 的 。 


你 可 能 认为 ， 对 于 枚 举 ， 使 用 Map 是 没有 必要 的 ， 比 如 对 于 上 面 的 
统计 例子 ， 可 以 使 用 一 个 简单 的 数组 : 





public static int[] countBySize(List<Clothes> clothes)t{ 
int[] stat = new int[Size.values().1length]; 
for(Clothes c : clothes)t{ 
Size size = c.getSize(); 
stat[size.ordinal()]++; 


return stat; 





这 个 方法 可 以 这 么 使 用 : 





List<Clothes> clothes = Arrays.asList(new Clothes[]{ 
new Clothes("c001",Size.SMALL), new Clothes("C002", Size.LARGE), 
new Clothes("Cc003", Size.LARGE), new Clothes("C004", Size.MEDIUM), 
new Clothes("Cc005", Size.SMALL), new Clothes("C006", Size.SMALL), 

}); 

int[] stat = countBySize(clothes); 

for(int i=0; i<stat.length; i++){ 

System.out.println(Size.values()[i]+": "+ stat[i]); 





输出 为 : 





SMALL 3 
MEDIUM 1 
LARGE 2 





可 以 达到 同样 的 目的 。 但 ， 直 接 使 用 数组 需要 自己 维护 数组 索引 和 
枚 举 值 之 间 的 关系 ， 正 如 枚 举 的 优点 是 简洁 、 安 全 、 方 便 一 样 ， 
EnumMap 同 样 是 更 为 简洁 、 安 全 、 方 便 ， 它 内 部 也 是 基于 数组 实现 
的 ， 但 隐藏 了 细节 ， 提 供 了 更 为 方便 安全 的 接口 。 


10.7.2 ”实现 原理 


下 面 我 们 来 看 下 具体 的 代码 (基于 Java 7) 。 从 内 部 组 成 开始 。 
EnumMap 有 如 下 实例 变量 : 





private final Class<k> keyType; 
private transient K[] keyUniverse; 
private transient Object[] vals; 
private transient int Size = 0; 





keyType 表 示 类 型 信息 ，keyUniverse 表 示 键 ， 是 所 有 可 能 的 枚 举 
ll size 表 示 键 值 对 个 数 。EnumMap 的 基本 构造 
方法 代码 为 : 





public EnumMap(Class<K> keyType) { 
this.keyType = keyType; 
keyUniverse = getkeyUniverse(keyType); 
vals = new Object[keyUniverse.length]; 


} 





调用 了 getKeyUniverse 以 初始 化 键 数组 ， 这 段 代 码 又 调用 了 其 他 一 
些 比较 底层 的 代码 ， 束 不 列举 了 ， 原 理 是 最 终 调用 了 枚 举 类 型 的 values 
方法 ，values 方 法 返回 所 有 可 能 的 枚 举 值 。 关 于 values 方 法 ， 我 们 在 枚 举 
一 节 介 绍 过 其 用 法 和 实现 原理 ， 这 里 束 不 次 述 了 。 


保存 键 值 对 的 方法 是 put， 代 码 为 : 








public V put(K key, V value) { 
typeCheck(key); 
int index = key.ordinal(); 
Object oldValue = vals[index]; 
vals[index] = maskNull(value); 
if(oldValue == null) 

Size++; 

return unmaskNull(oldValue); 





自 先 调用 typeCheck 检 查 键 的 类 型 ， 其 代码 为 : 





private void typeCheck(K key) { 
Class keyClass = key.getClass(); 
if(keyClass != keyType && keyClass.getSuperclass() != keyType) 
throw new ClassCastException(keyClass + " != " + keyType); 





如 果 类 型 不 对 ， 会 抛 出 异常 。 如 果 类 型 正确 ， 调 用 ordinal 获 取 有 索引 
index， 并 将 值 value 放 入 值 数组 vals[index] 中 。EnumMap 人 允许 值 为 null， 
为 了 区 别 null 值 与 没有 值 ，EnumMap 将 null 值 包装 成 了 一 个 特殊 的 对 
象 ， 有 两 个 辅助 方法 用 于 null 的 打包 和 解 包 ， 打 包 方 法 为 maskNull， 解 
包 方法 为 nmaskNull。 这 个 特殊 对 象 及 两 个 方法 的 代码 为 : 





private static final Object NULL = new Object() { 
public int hashCode() { 
return 0; 


} 
public String toString() { 
return "java.util.EnumMap.NULL",; 


} 


/ 
private Object maskNull(Object value) { 
return (value == null ? NULL : value); 


private V unmaskNull(Object value) { 
return(V) (value == NULL ? null : value); 





根据 键 获取 值 的 方法 是 get， 代 码 为 : 





public V get(Object key) { 
return (isValidkKey(key) 
unmaskNull(vals[((Enum)key).ordinal()]) : null); 





如 果 刍 有效， 通过 ordinal 方 法 取 索 引 ， 然 后 直接 在 值 数组 vals 里 
找 。isValidKey 的 代码 与 typeCheck 类 似 ， 但 是 返回 boolean 值 而 不 是 抛 出 
寞 第 ， 代 码 为 : 





private boolean isValidKey(Object key) { 
if(key == null) 
return false; 
//Cheaper than instanceof Enum followed by getDeclaringClass 
Class keyClass = key.getClass(); 
return keyClass == keyType || keyClass.getSuperclass() == keyType; 











查看 是 否 包含 菜 个 值 的 方法 是 containsValue， 代 码 为 : 





public boolean containsvalue(Object value) { 
value = maskNull(value); 
for(Object val : vals) 
if(value.equals(val)) 
return true; 
return false; 





就 是 所 历 值 数组 进行 比较 。 
根据 键 删除 的 方法 是 remove， 其 代码 为 : 





public V remove(Object key) { 
if(!isValidkey(key)) 
return null; 


int index = ((Enum)key).ordinal(); 
Object oldValue = vals[index]; 
vals[index] = nuill; 
if(oldValue != null) 

Size--，; 
return unmaskNull(oldValue); 





代码 也 很 简单 ， 就 不 解释 了 。 
10.7.3 ”小 结 


本 节 介 绍 了 EnumMap 的 用 法 和 实现 原理 ， 用 法 上 ， 如 果 需 要 一 个 
Map 且 键 是 枚 举 类 型 ， 则 应 该 用 它 ， 简 洁 、 方 便 、 安 全 ; 实现 原理 上 ， 
内 部 有 两 个 数组 ， 长 度 相 同 ， 一 个 表示 所 有 可 能 的 键 ， 一 个 表示 对 应 的 
值 ， 值 为 null 表 示 没 有 该 键 值 对 ， 键 都 有 一 个 对 应 的 索引 ， 根 据 索引 可 
直接 访问 和 操作 其 键 和 值 ， 效 率 很 高 。 


下 一 节 ， 我 们 来 看 枚 举 类 型 的 Set 接 口 的 实现 类 EnumSet， 与 之 前 介 
绍 的 Set 的 实现 类 不 同 ， 它 内 部 没有 用 对 应 的 Map 类 EnumMap， 而 是 使 
用 了 一 种 极为 高 效 的 方式 ， 什 么 方式 呢 ? 











10.8 衣 析 EnumSet 





本 节 介 绍 同样 针对 枚 举 类 型 的 Set 接 口 的 实现 类 EnumSet。 与 
EnumMap 类 似 ， 之 所 以 会 有 一 个 专门 的 针对 枚 举 类 型 的 实现 类 ， 主 要 
是 因为 它 可 以 非常 高 效 地 实现 Set 接 口 。 


之 前 介绍 的 Set 接 口 的 实现 类 HashSet/TreeSet， 它 们 内 部 都 是 用 对 应 
的 HashMap/TreeMap 实 现 的 ， 但 EnumSet 不 是 ， 它 的 实现 与 EnumMap 没 
有 任何 关系 ， 而 是 用 极为 精简 和 高 效 的 位 同 量 实现 的 。 位 同 量 是 计算 
机 程序 中 解决 问题 的 一 种 常用 方式 ， 我 们 有 必要 理解 和 掌握 。 


除了 实现 机 制 ，EnumSet 的 用 法 也 有 一 些 不 同 。EnumSet 可 以 说 是 
处 理 枚 举 类 型 数据 的 一 把 利器 ， 在 一 些 应 用 领域 ， 它 非常 方便 和 高 效 。 


下 面 ， 我 们 先 来 看 EnumSet 的 基本 用 法 ， 然 后 通过 一 个 场景 来 看 
EnumSet 的 应 用 ， 最 后 分 析 EnumSet 的 实现 机 制 |。 














10.8.1 基本 用 法 


与 TreeSet/HashSet 不 同 ，EnumSet 是 一 个 抽象 类 ， 不 能 直接 通过 
new 新 建 ， 也 就 是 说 ， 类 似 下 面 代码 是 错误 的 : 








EnumSet<Size> Set = new EnumSet<Size>() 





不 过 ，Enumset 提 供 了 寿 干 静态 工厂 方法 ， 可 以 创建 EnumSet 类 型 
的 对 象 ， 比 如 : 





public static <E extends Enum<E>> EnumSet<E> noneof (Class<E> elementType) 





noneOf 方 法 会 创建 一 个 指定 枚 举 类 型 的 EnumSet， 不 仿 任 何 元 素 。 
创建 的 EnumSet 对 象 的 实际 类 型 是 EnumSet 的 子 类 ， 待 会 我 们 再 分 析 其 
具体 实现 。 


为 方便 举例 ， 我 们 定义 一 个 表示 星期 几 的 枚 举 类 Day， 值 从 周一 到 
周 日 ， 如 下 所 示 : 





enum Day { 
MONDAY, TUESDAY, WEDNESDAY, THURSDAY, FRIDAY, SATURDAY, SUNDAY 
} 





可 以 这 么 用 noneOf 方 法 : 





Set<Day> weekend = EnumSet ,noneof(Day,class ) ; 
weekend ,add(Day ,SATURDAY ) ; 

weekend ,add(Day ,SUNDAY ) ; 
System,out.println(weekend ) ; 





weekend 表 示 休 忌日 ，noneOf 返 回 的 Set 为 空 ， 添加 了 周 六 和 周 日 ， 
所 以 输出 为 : 





[SATURDAY, SUNDAY] 





EnumSet 还 有 很 多 其 他 静态 工 三方 法， 如 下 所 示 (省 略 了 修饰 public 


static) : 








// 初 始 集合 包括 指定 枚 举 类 型 的 所 有 枚 举 值 

<E _ extends Enum<E>> EnumSet<E> allof(Class<E> elementType) 
// 初 始 集合 包括 枚 举 值 中 指定 范围 的 元 素 
<E _ extends Enum<E>> EnumSet<E> 
// 初 始 集合 包括 指定 集合 的 补 集 

<E _ extends Enum<E>> EnumSet<E> 



































range(E from, E to) 


complementOof(EnumSet<E> s) 


























// 初 始 集合 包括 参数 中 的 所 有 元 素 

<E _ extends Enum<E>> EnumSet<E> of(E e) 

<E _ extends Enum<E>> EnumSet<E> of(E e1，E e2) 

<E _ extends Enum<E>> EnumSet<E> of(E e1，E e2, e3) 

<E _ extends Enum<E>> EnumSet<E> of(E e1，E e2, e3, E e4) 

<E extends Enum<E>> EnumSet<E> of(E e1，E e2, e3, E e4, E e5) 
<E extends Enum<E>> EnumSet<E> of(E first, E... rest) 








// 初 始 集合 包括 参数 容器 中 的 所 有 元 素 
<E _ extends Enum<E>> EnumSet<E> 
<E _ extends Enum<E>> EnumSet<E> 




















copyof(EnumSet<E> s) 
copyof(Collection<E> c) 





可 以 看 到 ，EnumSet 有 很 多 重 载 形 式 的 of 方法 ， 最 后 一 个 接受 的 是 
可 变 参数 ， 其 他 重 载 方法 看 上 去 是 多 余 的 ， 之 所 以 有 其 他 重 载 方法 是 因 
为 可 变 参数 的 运行 效率 低 一 些 。 


10.8.2 ”应 用 场景 


下 面 ， 我 们 通过 一 个 场景 来 看 EnumSet 的 应 用 。 想 象 一 个 场景 ， 在 
一 些 工 作 中 《〈 如 医生 、 客 服 ) ， 不 是 每 个 工作 人 员 每 天 都 在 的 ， 每 个 人 
可 工作 的 时 间 是 不 一 样 的 ， 比 如 张 三 可 能 是 周一 和 周三 ， 李 四 可 能 是 周 
人 

0D: 

:有 没有 哪 天 一 个 人 都 不 会 来 ? 

:有 哪些 天 至 少 会 有 一 个 人 来 ? 

:有 哪些 天 至 少 会 有 两 个 人 来 ? 

:有 哪些 天 所 有 人 都 会 来 ， 以 便 开 会 ? 

:哪些 人 周一 和 周二 都 会 来 ? 


使 用 EnumSet， 可 以 方便 高 效 地 回答 这 些 问 题 ， 怎 么 做 呢 ? 我 们 先 
来 定义 一 个 表示 工作 人 员 的 类 Worker， 如 下 所 示 : 




















class Worker { 
String name 
Set<Day> availableDays,; 
public Worker(String name, Set<Day> availableDays) { 
this.name = name; 
this.availableDays = availableDays; 





} 
// 省 略 getter 方 法 





为 演示 方便 ， 将 所 有 工作 人 员 的 信息 放 到 一 个 数组 workers 中 ， 如 
下 二 不 : 





Worker[] workers = new Worker[]{ 
new Worker(" 张 三 "，EnumSet ,of( 
Day .MONDAY, Day .TUESDAY, Day .WEDNESDAY, Day.FRIDAY)), 
new Worker(" 李 四 "，EnumSet .of( 
Day ,TUESDAY，Day ,THURSDAY，Day ,SATURDAY) ) ， 
new Worker(" 王 五 "，EnumSet .of(Day.TUESDAY, Day .THURSDAY)), 





}; 


一 





每 个 工作 人 员 的 可 工作 时 间 用 一 个 EnumSet 表 示 。 有 了 这 个 信息 ， 
我 们 就 可 以 回答 以 上 的 问题 了 。 哪 些 天 一 个 人 都 不 会 来 ? 代码 可 以 为 : 





Set<Day> days = EnumSet ,allof(Day.class ) ， 
for(worker w : workers)t 
days.removeAll(w.getAvailableDays()); 


System.out.printlin(days); 





days 初 始 化 为 所 有 值 ， 然 后 裔 历 workers， 从 days 中 删除 可 工作 的 所 
有 了 时间， 最 终 剩 下 的 就 是 一 个 人 都 不 会 来 的 时 间 ， 这 实际 是 在 求 worker 
时 间 并 集 的 补 集 ， 输 出 为 : 








[SUNDAY] 





有 哪些 天 至 少 会 有 一 个 人 来 ? 束 古 求 worker 时 间 的 并 集 ， 代 码 可 以 


站 
AN 





Set<Day> days = EnumSet ,noneof(Day,.class) 
for(worker w : workers)t 
days.addAll(w.getAvailableDays()); 


System.out.println(days); 





输出 为 : 





[MONDAY, TUESDAY, WEDNESDAY, THURSDAY, FRIDAY， SATURDAY] 





有 哪些 天 所 有 人 都 会 来 ? 就 是 求 worker 时 间 的 交集 ， 代 码 可 以 为 : 





Set<Day> days = EnumSet.allof(Day.class); 
for(worker w : workers)t 
days.retainAll(w.getAvailableDays()); 


System.out.println(days); 





输出 为 : 





[TUESDAY] 





哪些 人 周一 和 周二 都 会 来 ? 使 用 containsAll 方 法 ， 代 码 可 以 为 : 





Set<worker> availableworkers = new HashSet<Worker>() 
for(Worker w : workers)t 
if(w.getAvailableDays().containsAll( 
EnumSet .of (Day .MONDAY, Day .TUESDAY) ) ){ 
availableworkers.add(w); 


for(worker w : availableworkers){ 
System.out.println(w.getName( )); 
} 





输出 为 : 





张 三 





哪些 天 至 少 会 有 两 个 人 来 ?我 们 先 使 用 EnumMap 统 计 每 天 的 人 
数 ， 然 后 找 出 至 少 有 两 个 人 的 天 ， 代 码 可 以 为 : 





Map<Day, Integer> countMap = new EnumMap<>(Day.class); 
for(Worker w : workers)t 
for(Day d : w.getAvailableDays()){ 
Integer count = countMap.get(d); 
countMap.put(d, count==null?1:count+1); 
} 
} 
Set<Day> days = EnumSet.noneof(Day.class); 
for(Map.Entry<Day, Integer> entry : countMap.entrySet()){ 
if(entry.getValue( )>=2){ 
days.add(entry.getkey()); 


System.out.println(days); 





输出 为 : 





[TUESDAY, THURSDAY] 








理解 了 EnumSet 的 使 用 ， 下 面 我 们 来 看 它 是 怎么 实现 的 〈 基 于 Java 
Fg 


10.8.3 ”实现 原理 


EnumSet 是 使 用 位 向 量 实现 的 ， 什 么 是 位 向 量 呢 ? 就 是 用 一 个 位 表 
示 一 个 元 素 的 状态 ， 用 一 组 位 表示 一 个 集合 的 状态 ， 每 个 位 对 应 一 个 元 
素 ， 而 状态 只 可 能 有 两 种 。 


对 于 之 前 的 枚 举 类 Day， 它 有 7 个 枚 举 值 ， 一 个 Day 的 集合 就 可 以 用 
个 字 节 byte 表 示 ， 最 高 位 不 用 ， 设 为 0， 最 右边 的 位 对 应 顺序 最 小 的 
枚 举 值 ， 从 右 到 左 ， 每 位 对 应 一 个 枚 举 值 ，1 表 示 包 含 该 元 素 ，0 表 示 不 


含 该 元 素 。 








比如 ， 表 示 包 含 DayMONDAY 、Day.TUESDAY、 
Day.WEDNESDAY、Day.FRIDAY 的 集合 ， 位 向 量 结构 如 图 10-14 所 
和 修 。 





周 日 周 六 周 五 周 四 周三 周二 周一 
图 10-14 位 辐 量 示 例 


对 应 的 整数 是 23。 


”位 同 量 能 表示 的 元 素 个 数 与 问 量 长 度 有 关 ， 一 个 byte 类 型 能 表示 8 
个 元 素 ， 一 个 long 类 型 能 表示 64 个 元 素 ， 那 EnumSet 用 的 长 度 是 多 少 
呢 ? 


EnumSet 是 一 个 抽象 类 ， 它 没有 定义 使 用 的 向 量 长 上 度 ， 它 有 两 个 子 
类 : RegularEnumSet 和 JumboEnumSet。RegularEnumSet 使 用 一 个 long 类 
型 的 变量 作为 位 向 量 ，long 类 型 的 位 长 度 是 64， 而 JumboEnumSet 使 用 一 
个 long 类 型 的 数组 。 如 有 果 枚 举 值 个 数 小 于 等 于 64， 则 静态 工厂 方法 中 创 
建 的 就 是 RegularEnumSet， 如 果 大 于 64 就 是 JumboEnumSet。 


理解 了 位 同 量 的 基本 概念 ， 下 面 我 们 来 看 EnumSet 的 实现 ， 包 括 其 
内 部 组 成 和 一 些 主要 方法 的 实现 。 同 EnumMap 一 样 ，EnumSet 也 有 表示 
类 型 信息 和 所 有 枚 举 值 的 实例 变量 ， 如 下 所 示 : 























final Class<E> elementType,; 
final Enum[] universe; 





elementType 表 示 类 型 信息 ，universe 表 示 枚 举 类 的 所 有 枚 举 值 。 


EnumSet 自 身 没 有 记录 元 素 个 数 的 变量 ， 也 没有 位 向 量 ， 它 们 是 子 
类 维护 的 。 对 于 RegularEnumSet， 它 用 一 个 long 类 型 表示 位 向 量 ， 代 码 

















private long elements = OL; 








它 没有 定义 表示 元 素 个 数 的 变量 ， 是 实时 计算 出 来 的 ， 计 算 的 代码 


ft 





public int size() { 
return Long.bitCount(elements); 





对 于 JumboEnumSet， 它 用 一 个 long 数 组 表示 ， 有 单独 的 size 变 量 ， 
代码 为 : 





private long elements[]; 
private int Size = 0; 





我 们 来 看 EnumSet 的 静态 工厂 方法 noneOf， 代 码 为 : 





public static <E extends Enum<E>> EnumSet<E> noneOof(Class<E> elementType) { 
Enum[] universe = getUniverse(elementType); 
if(universe == null) 
throw new ClassCastException(elementType + " not an enum"); 
if(universe.length <= 64) 
return new RegularEnumSet<>(elementType, universe); 
else 
return new JumboEnumSet<>(elementType, universe),; 





getUniverse 的 代码 与 EnumMap 是 一 样 的 ， 就 不 葡 述 了 。 如 有 果 元 素 个 
数 不 超 过 64， 就 创建 RegularEnumSet， 和 否则 创建 JumboEnumSet。 


RegularEnumSet 和 JumboEnumSet 的 构造 方法 为 : 





RegularEnumSet (Class<E>elementType, Enum[] universe) { 
super (elementType, universe); 


JumboEnumSet (Class<E>elementType, Enum[] universe) { 
super (elementType, universe); 
elements = new long[(universe.length + 63) >>> 6]; 


} 





它们 都 调用 了 父 类 EnumSet 的 构造 方法 ， 其 代码 为 : 





EnumSet(Class<E>elementType, Enum[] universe) { 
this.elementType = elementType; 
this.universe = universe; 








就 是 给 实例 变量 赋值 ，JumboEnumSet 根 据 元 素 个 数 分 配 足够 长 度 
的 long 数 组 。 


其 他 工厂 方法 基本 都 是 先 调用 noneOf 方 法 构造 一 个 空 的 集合 ， 然 后 
再 调用 添加 方法 。 我 们 来 看 添加 方法 ，RegularEnumSet 的 add 方 法 的 代 
码 为 : 








public boolean add(E e) { 


typeCheck(e); 

long oldElements = elements,; 

elements |= (1L << ((Enum)e).ordinal()); 
return elements != oldElements; 





主要 代码 是 按 位 或 操作 : 





elements |= (1L << ((Enum)e).ordinal()); 





(1L<<( (Enum) e) .ordinal () ) 将 元 素 e 对 应 的 位 设 为 1， 与 现 
有 的 位 辐 量 elements 相 或 ， 就 表示 添加 ae 了。JumboEnumSet 的 add 方 法 的 
代码 为 : 





public boolean add(E e) { 


typeCheck(e); 

int eOrdinal = e.ordinal(); 

int ewordNum = eordinal >>> 6; 

long oldElements = elements[ewordNum]; 


elements[ewordNum] |= (1L << eoOrdinal); 
boolean result = (elements[eWordNum] != oldElements); 
if(result) 

Size++; 


return result,; 








与 RegularEnumSet 的 add 方 法 的 区 别 是 ， 它 先 找 对 应 的 数组 位 置 ， 
eOrdinal>>>6 就 是 eOrdinal 除 以 64，eWordNum 就 表示 数组 索引 ， 有 了 过 
引 之 后 ， 其 他 操作 与 Regular-EnumSet 就 类 似 了 。 


对 于 其 他 操作 ，JumboEnumSet 的 思路 是 类 似 的 ， 主 要 算法 与 
RegularEnumSet 一 样 ， 主 要 是 增加 了 寻找 对 应 long 位 同 量 的 操作 ， 或 者 
有 一 些 循环 处 理 ， 逻 辑 也 都 比较 简单 ， 后 文 就 只 介绍 RegularEnumSet 的 
实现 了 。 





RegularEnumSet 的 remove 方 法 的 代码 为 : 





public boolean remove(Object e) { 

if(e == null) 
return false; 

Class eClass = e.getClass(); 

if(eClass != elementType && eClass.getSuperclass() != elementType) 
return false; 

long oldElements = elements,; 

elements &= ~(1L << ((Enum)e).ordinal()); 

return elements != oldElements; 





主要 代码 是 : 





elements &= ~(1L << ((Enum)e).ordinal()); 








~ 是 取 反 ， 该 代码 将 元 素 e 对 应 的 位 设 为 了 0， 这 样 就 完成 了 删除 。 
查看 是 否 包 含 某 元 素 的 方法 是 contains， 其 代码 为 : 











public boolean contains(Object e) { 
if(e == null) 


return false; 

Class eClass = e.getClass() 

if(eClass != elementType && eClass.getSuperclass() != elementType) 
return false; 

return (elements & (1L << ((Enum)e).ordinal())) != 9; 





代码 也 很 简单 ， 按 位 与 操作 ， 不 为 0， 则 表示 包含 。 
EnumSet 的 静态 工厂 方法 complementOf 是 求 补 集 ， 它 调用 的 代码 


日 
XE : 





void complement() { 
if(universe.length != 0) { 
elements = ~elements,; 
elements &= -1L >>> -universe.length; // Mask unused bits 
} 
} 





这 段 代 码 有 点 星 深 ，elements=~elements 比 较 容易 理解 ， 就 是 按 位 
相当 于 就 是 取 补 集 ， 但 我 们 知道 elements 是 64 位 的 ， 当 前 枚 举 类 
可 能 没有 用 那么 多 位 ， 取 反 后 高 位 部 分 都 变 为 了 1， 需 要 将 超出 
universe.length 的 部 分 设 为 0。 下 面 的 代码 就 是 在 做 这 件 事 : 








elements &= -1L >>> -universe.length; 





-] 工 是 64 位 全 1 的 二 进 制 ， 我 们 在 训 析 Integer 一 节 介 绍 过 移动 位 数 是 
负数 的 情况 ， 上 面 代码 相当 于 : 





elements &= -1L >>> (64-universe.length); 





如 果 universelength 为 7， 则 -1L>>> (64-7) 就 是 二 进 制 的 1111111， 
与 elements 相 与 ， 就 会 将 超出 universe.length 部 分 的 右边 的 57 位 都 变 为 0。 


以 上 就 是 EnumSet 的 基本 实现 原理 ， 内 部 使 用 位 癌 量 ， 表 示 很 简 
洁 ， 节 省 空间 ， 大 部 分 操作 都 是 按 位 运算 ， 效 率 极 高 。 





10.8.4 小结 


本 节 介 绍 了 EnumSet 的 用 法 和 实现 原理 ， 用 法 上 ， 它 是 处 理 枚 举 类 
0 80 50 0 
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对 于 只 有 两 种 状态 ， 且 需要 进行 集合 运算 的 数据 ， 使 用 位 癌 量 进行 
表示 、 位 运算 进行 处 理 ， 是 计算 机 程序 中 一 种 常用 的 思维 方式 。 


Java 中 有 一 个 更 为 通用 的 可 动态 扩展 长 度 的 位 向 量 容 器 类 BitSet， 
可 以 方便 地 对 指定 位 置 的 位 进行 操作 ， 与 其 他 位 辐 量 进行 位 运算 ， 有 具体 
可 参看 API 文 档 ， 我 们 束 不 介绍 了 。 


至 此 ， 关 于 Map 和 Set 的 实现 类 就 介绍 完了 ， 关 于 它们 的 系统 总 结 ， 
ee 
Aa); 堆 。 




















第 11 革 ” 堆 与 优先 级 队列 


前 面 两 草 介绍 了 Java 中 的 基本 容器 类 ， 每 个 容器 类 背后 都 有 一 种 数 
据 结 构 ，ArrayList 是 动态 数组 ，LinkedList 是 链表 ，HashMap/HashSet 是 
哈 希 表 ，TreeMap/TreeSet 是 红 黑 树 ， 本 章 介 绍 男 一 种 数据 结构 : 堆 。 之 
前 我 们 提 到 过 堆 ， 那 里 ， 挫 指 的 是 内 存 中 的 区 域 ， 保 存 动态 分 配 的 对 
象 ， 与 栈 相 对 应 。 这 里 的 堆 是 一 种 数据 结构 ， 与 内 存 区 域 和 分 配 无 关 。 


堆 到 底 是 什么 结构 呢 ? 这 个 待 会 再 细 看 。 我 们 先 来 说 明 ， 堆 有 什么 
用 ? 为 什么 要 介绍 它 ? 堆 可 以 非常 高 效 方便 地 解决 很 多 问题 ， 比如 : 


1) 优先 级 队列 ， 我 们 之 前 介绍 的 队列 实现 类 LinkedList 是 按 添 加 顺 
序 排列 的 ， 但 现实 中 ， 经 常 需要 按 优先 级 来 ， 每 次 都 应 该 处 理 当 前 队列 
中 优先 级 最 高 的 ， 高 优先 级 的 即使 来 得 晚 ， 也 应 该 被 优先 处 理 。 


2) 求 前 K 个 最 大 的 元 素 ， 元 系 个 数 不 确定 ， 数 据 量 可 能 很 大 ， 甚 
至 源源 不 断 到 来 ， 但 需要 知道 到 目前 为 止 的 最 大 的 前 K 个 元 素 。 这 个 问 
人 
J 元 系 。 


3) 求 中 值 元 素 ， 中 值 不 是 平均 值 ， 而 是 排序 后 中 间 那 个 元 系 的 
值 ， 同 样 ， 数 据 量 可 能 很 大 ， 甚 至 源源 不 断 到 来 。 


堆 还 可 以 实现 排序 ， 称 之 为 堆 排序 ， 不 过 有 比 它 更 好 的 排序 算法 ， 
所 以 ， 我 们 就 不 介绍 其 在 排序 中 的 应 用 了 。 


Java 容 器 中 有 一 个 类 PriorityQueue， 表 示 优 先 级 队列 ， 它 实现 了 
堆 ， 本 章 我 们 会 详细 介绍 。 关 于 如 何 使 用 堆 高 效 解决 求 前 K 个 最 大 的 元 
素 和 求 中 值 元 素 ， 我 们 也 会 在 本 章 中 用 代码 实现 并 详细 解释 。 


说 了 这 么 多 好 处 ， 堆 到 后 是 什么 呢 ? 我 们 先 来 看 堆 的 基本 概念 与 算 
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11.1 扒 的 概念 与 算法 

我 们 先 来 了 解 堆 的 概念 ， 然 后 介绍 堆 的 一 些 主要 算法 。 
11.1.1 基本 概念 

堆 首 先是 一 棵 二 叉 树 ， 但 它 是 完全 二 又 树 。 什 么 是 完全 二 又 树 
呢 ? 我 们 先 来 看 另 一 个 相似 的 概念 ， 满 二 又 树 。 满 二 叉 树 是 指 除 了 最 


后 一 层 外 ， 每 个 节点 都 有 两 个 孩子 ， 而 最 后 一 层 都 是 叶子 节点 ， 都 没有 
孩子 。 比 如 ， 图 11-1 所 示 两 棵 二 叉 树 都 是 满 二 又 树 。 
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a) b) 
图 11-1 满 二 又 树 示例 
满 二 叉 树 一 定 是 完全 二 义 树 ， 但 完全 二 叉 树 不 要 求 最 后 一 层 是 满 


的 ， 但 如 果 不 满 ， 则 要 求 所 有 节点 必须 集中 在 最 左边 ， 从 左 到 右 是 连续 
的 ， 中 间 不 能 有 空 的。 比如 ， 图 11-2 所 示 几 棵 二 又 树 都 是 完全 二 又 树 。 














a) b) c) d) 
图 11-2 ”完全 二 叉 树 示例 
而 图 11-3 所 示 的 几 棵 二 又 树 则 都 不 是 完全 二 叉 树 。 





a) b) c) 
图 11-3” 非 完全 二 又 树 示例 


在 完全 二 文 树 中 ， 可 以 给 每 个 节点 一 个 编号， 编写 从 1 开始 连续 弟 
增 ， 从 上 到 下 ， 从 左 到 右 ， 如 图 11-4 所 示 。 
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图 11-4 完全 二 又 树 编 号 


完全 二 又 树 有 一 个 重要 的 特点 : 给 定 任 意 一 个 市 态 ， 可 以 根据 其 编 
写 直 接 快 速 计算 出 其 父 市 点 和 孩子 市 点 编号 。 如 果 编 号 为 ， 则 父 节 点 
编号 即 为 12， 左 孩子 编号 即 为 2xi， 右 孩子 编号 即 为 2xi+1。 比 如 ， 对 于 
5 号 节点 ， 父 节点 为 502 即 2， 左 孩子 为 2x5 即 10， 右 孩子 为 2x5+1 即 11。 





这 个 特点 为 什么 重要 了 呢 ? 它 使 得 多 辑 概念 上 的 二 又 树 可 以 方便 地 存 
储 到 数组 中 ， 数组 中 的 元 素 索 引 就 对 应 节 扣 的 编号 ， 树 中 的 父子 关系 
通过 其 索引 关系 隐 伟 维持 ， 不 需要 单独 保持 。 比 如 ， 图 11-4 所 示 的 逻辑 
二 又 树 ， 保 存 到 数组 中 ， 其 结构 如 图 11-5 所 示 。 
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图 11-5 ”用 数组 表示 完全 二 又 树 


父子 关系 是 隐 含 的 ， 比 如 对 于 第 5 个 元 素 13， 其 父 节 点 就 是 第 2 个 元 
素 15， 左 孩子 就 是 第 10 个 元 素 7， 右 护 子 就 是 第 11 个 元 素 4。 


这 种 存储 二 叉 树 的 方法 与 之 前 介绍 的 TreeMap 是 不 一 样 的 。 在 
TreeMap 中 ， 有 一 个 单独 的 内 部 类 Entry，Entry 有 三 个 引用 ， 分 别 指向 父 
节点 、 左 孩子 、 右 孩子 。 使 用 数组 存储 的 优点 是 节省 空间 ， 而 且 访 问 效 
率 高 。 堆 逻辑 概念 上 是 一 棵 完全 二 又 树 ， 而 物理 存储 上 使 用 数组 ， 还 有 
一 定 的 顺序 要 求 。 


之 前 介绍 过 排序 二 又 树 。 排 序 二 又 树 是 完全 有 序 的 ， 每 个 节点 都 有 
确定 的 前 驱 和 后 继 ， 而 且 不 能 有 重复 元 系 。 与 排序 二 又 树 不 同 ， 在 堆 
中 ， 可 以 有 重复 元 素 ， 元 素 间 不 是 完全 有 序 的 ， 但 对 于 父子 点 之 间 ， 
根据 顺序 分 为 两 种 堆 : 一 种 是 最 大 堆 ， 另 一 种 是 
最 小 堆 。 


最 大 堆 是 指 每 个 节点 都 不 大 于 其 父 季 把。 这 样 ， 对 每 个 父 节 乒 ， 一 
定 不 小 于 其 所 有 孩子 市 皮 ， 而 根 节点 就 是 所 有 节点 中 最 大 的 ， 对 每 个 子 
树 ， 子 树 的 根 也 是 子 树 所 有 节点 中 最 大 的 。 最 小 扒 与 最 大 堆 正 好 相反 ， 
每 个 节点 都 不 小 于 其 父 节 点 。 这 样 ， 对 每 个 父 节 点 ， 一 定 不 大 于 其 所 有 
孩子 节点 ， 而 根 节 点 就 是 所 有 节点 中 最 小 的 ， 对 每 个 子 树 ， 子 树 的 根 也 
是 子 树 所 有 节操 中 最 小 的 。 我 们 看 个 例子 ， 如 图 11-6 所 示 。 


总 结 来 说， 逻辑 概念 上 ， 堆 是 完全 二 又 树 ， 父 子 节 点 间 有 特定 顺 
序 ， 分 为 最 大 堆 和 最 小 堆 ， 最 大 扒 根 是 最 大 的 ， 最 小 堆 根 是 最 小 的 ， 堆 
使 用 数组 进行 物理 存储 。 


为 什么 堆 可 以 高 效 地 解决 之 前 我 们 说 的 问题 呢 ? 在 回答 之 前 ， 我 们 
需要 先 看 下 ， 如 何在 堆 上 进行 数据 的 基本 操作 ， 在 操作 过 程 中 如 何 保持 
堆 的 属性 不 变 。 
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a) 最 大 堆 b) 最 小 堆 


图 11-6 ”最 大 堆 与 最 小 堆 示 例 


11.1.2 ” 堆 的 算法 

下 面 ， 我 们 介绍 如 何在 堆 上 进行 数据 的 基本 操作 。 最 大 堆 和 最 小 堆 
的 算法 是 类 似 的 ， 我 们 以 最 小 堆 来 说 明 。 先 来 看 如 何 添加 元 素 。 
1. 添 加 元 素 


如 末 堆 为 空 ， 则 下 接 添 加 一 个 根 残 行 了 。 我 们 假定 已 经 有 一 个 堆 ， 
要 在 其 中 添加 元 素 ， 基 本 步骤 为 : 


1) 添加 元 素 到 最 后 位 置 。 

2) 与 父 节 所 比较 ， 如 果 大 于 等 于 父 节 氮 ， 则 满足 堆 的 性 质 ， 结 
束 ， 人 否则 与 父 节 扣 进 行 交 换 ， 然 后 再 与 父 节 扣 比较 和 交换 ， 直 到 父 科 所 
为 空 或 者 大 于 等 于 父 节 后 。 


我 们 来 看 个 例子 。 图 11-7 是 添加 元 素 前 的 初始 结构 。 











图 11-7 堆 的 算法 示例 :添加 元 素 前 的 初始 结构 





添加 元 素 3， 第 一 步 后 ， 结 构 如 图 11-8 所 示 。 








图 11-8 ” 堆 的 算法 示例 : 添加 元 素 3 第 一 步 后 的 结构 


3 小 于 父 节点 8， 不 满足 最 小 堆 的 性 质 ， 所 以 与 父 节 点 交换 ， 变 为 图 
11-9 所 示 。 


交换 后 ，3 还 是 小 于 父 节 点 6， 所 以 继续 交换 ， 变 为 图 11-10 所 示 。 
交换 后 ，3 还 是 小 于 父 节 点 ， 也 是 根 节 点 4， 继 续 交 换 ， 变 为 图 11- 


11 所 示 。 





图 11-9 堆 的 算法 示例 : 添加 元 素 3 第 一 次 交换 后 的 结构 
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图 11-10 堆 的 算法 示例 : 添加 元 素 3 第 二 次 交换 后 的 结构 





图 11-11 扒 的 算法 示例 : 添加 元 素 3 第 三 次 交换 后 的 结构 

至 此 ， 调 整 结束 ， 树 保持 了 堆 的 性 质 。 

从 以 上 过 程 可 以 看 出 ， 添 加 一 个 元 系 ， 需 要 比较 和 交换 的 次 数 最 多 
为 树 的 高 度 ， 即 log2 (N)〉，N 为 节点 数 。 这 种 目 底 癌 上 比较 、 交 换 ， 
使 得 树 重新 满足 堆 的 性 质 的 过 程 ， 我 们 称 为 向 上 调整 siftup)。 

2. 从 头 部 删除 元 素 


在 队列 中 ， 一 般 是 从 头 部 删除 元 系 ，Java 中 用 堆 实 现 优 先 级 队列 。 
下 面 介 绍 如 何在 扒 中 删除 头 部 ， 其 基本 步骤 为 : 


1) 用 最 后 一 个 元 素 蔡 换 头 部 元 素 ， 并 有 删 挥 最 后 一 个 元 素 ; 

2) 将 新 的 头 部 与 两 个 孩子 节点 中 较 小 的 比较 ， 如 果 不 大 于 该 孩子 
节点 ， 则 满足 堆 的 性 质 ， 结 束 ， 否 则 与 较 小 的 孩子 节点 进行 交换 ， 交 换 
后 ， 再 与 较 小 的 孩子 节点 比较 和 交换 ， 一 直到 没有 孩子 节点 ， 或 者 不 大 
于 两 个 孩子 节点 。 这 个 过 程 称 为 癌 下 调整 (siftdown) 。 

我 们 来 看 个 例子 。 图 11-12 是 删除 元 素 前 的 初始 结构 。 


执行 第 一 步 ， 用 最 后 元 素 蔡 换 头 部 ， 如 图 11-13 所 示 。 
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图 11-12 ” 堆 的 算法 示例 : 删除 元 素 前 的 初始 结构 





图 11-13 ” 堆 的 算法 示例 : 删除 头 部 元 素 第 一 步 后 的 结构 


现在 根 节点 16 大 于 孩子 节点 ， 与 更 小 的 孩子 节点 6 进行 替换 ， 结 构 
变 为 图 11-14 所 示 。 


16 还 是 大 于 孩子 节点 ， 与 更 小 的 孩子 8 进行 交换 ， 结 构 如 图 11-15 所 


修 。 
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图 11-15 堆 的 算法 示例 : 删除 头 部 元 际 第 二 次 交换 后 的 结构 


至 此 ， 就 满足 堆 的 性 质 了 。 
3. 从 中 间 删 除 元 素 

那 如 果 需 要 从 中 间 删 除 某 个 节点 呢 ? 与 从 头 部 删除 一 样 ， 都 是 先 用 
最 后 一 个 元 素 蔡 换 待 删 元 素 。 不 过 蔡 换 后 ， 有 两 种 情况 : 如 果 该 元素 大 
于 某 孩 子 节点 ， 则 需 向 下 调整 (sift-down) ; 如 果 小 于 父 节点 ， 则 需 向 
上 调整 (siftup) 。 

我 们 来 看 个 例子 ， 删 除 值 为 21 的 节点 ， 第 一 步 如 图 11-16 所 示 。 


蔡 换 后 ，6 没 有 子 市 点 ， 小 于 父 节 点 12， 执 行 回 上 调整 〈siftup) 过 
程 ， 最 后 结果 如 图 11-17 所 示 。 


我 们 再 来 看 个 例子 ， 删 除 值 为 9 的 和 节点， 第 一 步 如 图 11-18 所 示 。 


交换 后 ，11 大 于 右 孩 子 10， 所 以 执行 回 下 调整 〈siftdown) 过 程 ， 
执行 结束 后 如 图 11-19 所 示 。 
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a) 删 除 21 b) 用 6 替换 
图 11-16 ” 堆 的 算法 示例 : 从 中 间 删 除 元 素 21 第 一 步 后 的 结构 


4. 构 建 初始 堆 


给 定 一 个 无 序数 组 ， 如 何 使 之 成 为 一 个 最 小 堆 呢 ? 将 普通 无 序数 组 
变 为 堆 的 过 程 称 为 hneapify。 基 本 思路 是 : 从 最 后 一 个 非 叶 子 节点 开始 ， 
一 直 往 前 直到 根 ， 对 每 个 节点 ， 执 行 网 下 调整 〈siftdown) 。 换 句 话 
说 ， 是 目 奔 向 上 ， 先 使 每 个 最 小 子 树 为 堆 ， 然 后 每 对 左右 子 树 和 其 父 节 
扩 合 并 ， 调 整 为 更 大 的 堆 ， 因 为 每 个 子 树 已 经 为 堆 ， 所 以 调整 就 是 对 父 





节点 执行 回 下 调整 〈siftdown) ， 这 样 一 直 合 并 调整 直到 根 。 这 个 算法 
的 伪 代 码 是 : 
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图 11-17 堆 的 算法 示例 : 从 中 间 删 除 元 素 21 调 整 后 的 结构 
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a) 删 除 9 b) 用 11 替 换 
图 11-18 堆 的 算法 示例 : 从 中 间 删 除 元 素 9 第 一 步 后 的 结构 


void heapify() { 
for(int i=size/2; i >= 1; i--) 
siftdown(i); 
} 


size 表 示 节 扩 个 数 ， 节 扩编 号 从 1 开始 ，size/2 表 示 第 一 个 非 叶 子 节 
扩 的 编写 。 


这 个 构建 的 时 间 效 率 为 ON)〉，N 为 节点 个 数 ， 具 体 就 不 证 明了 。 
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图 11-19 堆 的 算法 示例 : 从 中 间 有 删除 元 素 9 调 整 后 的 结构 
5. 查 找 和 遍历 


在 堆 中 进行 查找 没有 特殊 的 算法 ， 葡 是 从 数组 的 头 找 到 尾 ， 效 率 为 
O (CN) 。 


在 堆 中 进行 过 历 也 是 类 似 的 ， 堆 就 是 数组 ， 堆 的 衣 历 束 是 数组 的 志 
历 ， 第 一 个 元 素 是 最 大 值 或 最 小 值 ， 但 后 面 的 元 素 没有 特定 的 顺序 。 


需要 说 明 的 是 ， 如 果 是 逐个 从 头 部 删除 元 素 ， 那 么 堆 可 以 确保 输出 
是 有 序 的 。 


6. 算 法 小 结 

以 上 就 是 堆 操 作 的 主要 算法 ， 小 结 如 下 。 

1) 在 添加 和 删除 元 素 时 ， 有 两 个 关键 的 过 程 以 保持 堆 的 性 质 ， 一 
个 是 向 上 调整 〈siftup) ， 另 一 个 是 向 下 调整 〈siftdown) ， 它 们 的 效率 
都 为 O (log， (CN) ) 。 由 无 序数 组 构建 堆 的 过 程 heapify 是 一 个 自 底 辣 
上 循环 的 过 程 ， 效 率 为 O CN) 。 


2) 碍 找 和 壳 历 就 是 对 数组 的 查找 和 思 历 ， 效 率 为 O CN) 。 














有 





本 节 介 绍 了 堆 这 一 数据 结构 的 基本 概念 和 算法 。 堆 是 一 种 比较 神奇 
的 数据 结构 ， 概 念 上 是 树 ， 存 储 为 数组 ， 父 子 有 特殊 顺序 ， 根 是 最 大 
值 /最 小 值 ， 构 建 /添加 /删除 效率 都 很 高 ， 可 以 高 效 解决 很 多 问题 。 但 在 
Java 中 ， 堆 到 确 是 如 何 实现 的 呢 ? 本 章 开 头 提 到 的 那些 问题 ， 用 堆 到 搬 
如 何 解决 呢 ? 让 我 们 在 接 下 来 的 小 节 中 继续 探讨 。 








11.2” 谢 析 PriorityQueue 





本 节 探 讨 堆 在 Java 中 的 具体 实现 类 : PriorityQueue。 顾 名 思 义 ， 
PriorityQueue 是 优先 级 队列 ， 它 首先 实现 了 队列 接口 (Queue) ， 与 
LinkedList 类 似 ， 它 的 队列 长 上 度 也 没有 限制 ， 与 一 般 队 列 的 区 别 是 ， 它 
ys 每 个 元 素 都 有 优先 级 ， 队 头 的 元 素 永远 都 是 优先 级 最 
局 | 日 j 。 


PriorityQueue 内 部 是 用 堆 实现 的 ， 内 部 元 素 不 是 完全 有 序 的 ， 不 
过 ， 逐 个 出 队 会 得 到 有 序 的 输出 。 虽 然 名 字 叫 优先 级 队列 ， 但 也 可 以 将 
PriorityQueue 看 作 一 种 比较 通用 的 实现 了 堆 的 性 质 的 数据 结构 ， 可 以 用 
PriorityQueue 来 解决 适合 用 堆 解决 的 问题 ， 下 一 小 节 我 们 会 来 看 一 些 具 
体 的 例 了 了。 下面 ， 我 们 先 介绍 其 用 法 ， 搂 着 分 析 实 现代 码 ， 最 后 总 结 分 

何人 











11.2.1 基本 用 法 


PriorityQueue 实 现 了 Queue 接 口 ， 我 们 在 LinkedList 一 节 介 绍 过 
Queue， 为 便于 阅读， 这 里 重复 下 其 定义 : 





public interface Queue<E> extends Collection<E> { 
boolean add(E e); // 在 尾部 添加 元 素 ， 队 列 满 时 抛 异常 
boolean offer(E e); // 在 尾部 添加 元 素 ， 队 列 满 时 返回 false 
E remove(); // 删 除 头 部 元 素 , 队列 空 时 抛 异常 
E poll(); // 删 除 头 部 元 素 ， 队 列 空 时 返回 nu11 
E element(); // 查 看 头 部 元 素 , 队列 空 时 抛 异常 
E peek(); // 碍 看 头 部 元 素 ， 队 列 空 时 返回 nu11 






































PriorityQueue 有 多 个 构造 方法 ， 部 分 构造 方法 如 下 所 示 : 





public PriorityQueue() 
public PriorityQueue(int initialCapacity, Comparator<? super E> comparator) 
public PriorityQueue(Collection<? extends E> c) 





PriorityQueue 是 用 堆 实 现 的 ， 堆 物理 上 就 是 数组 ， 与 ArrayList 类 
似 ，PriorityQueue 同 样 使 用 动态 数组 ， 根 据 元 素 个 数 动态 扩展 ， 


initialCapacity 表 示 初 始 的 数组 大 小 ， 可 以 通过 参数 传 入 。 对 于 默认 构造 
方法 ，initialCapacity 使 用 默认 值 11。 对 于 最 后 的 构造 方法 ， 数 组 大 小 等 
于 参数 容器 中 的 元 素 个 数 。 与 TreeMap/TreeSet 类 似 ， 为 了 保持 一 定 顺 
序 ，PriorityQueue 要 求 要 么 元 素 实现 Comparable 接 口 ， 要 么 传递 一 个 比 
较 器 Comparator。 


我 们 来 看 个 基本 的 例子 : 








Queue<Integer> pq = new PriorityQueue<>(); 
pq.offer(10); 
pq.add(22); 
pq.addAll(Arrays.asList(new Integer[]{ 

11, 12, 34, 2, 7, 4, 15, 12, 8, 6, 19, 13 })); 
while(pq.peek()!=null1){ 

System.out.print(pq.poll() + " "); 
} 





代码 很 蚀 单 ， 添 加 元 系 ， 然 后 逐个 从 头 部 删除 ， 与 普通 队列 不 同 ， 
输出 是 从 小 到 大 有 序 的 : 





2467810 11 12 12 13 15 19 22 34 





如 果 和 希望 是 从 大 到 小 呢 ? 传递 一 个 逆序 的 Comparator， 将 第 一 行 代 
码 蔡 换 为 : 





Queue<Integer> pq = new PriorityQueue<>(11，Collections .reverseorder()) 





输出 就 会 变 为 : 





34 22 19 15 13 12 12 11 1087642 








我 们 再 来 看 个 例子 。 模 拟 一 个 任务 队列 ， 定 义 一 个 内 部 类 Task 表 示 
任务 ， 如 下 所 示 : 





static class Task { 
int priority; 
String name 
// 省 略 构 造 方法 和 getter 方 法 








Task 有 两 个 实例 变量 : priority 表 示 优 先 级 ， 值 越 大 优先 级 越 高 ; 
name 表 示 任 务 名 称 。Task 没 有 实现 Comparable， 我 们 定义 一 个 单独 的 静 
态 成 员 taskComparator 表 示 比 较 器 ， 如 下 所 示 : 





private static Comparator<Task> taskComparator = new Comparator<Task>() { 
Q@Override 
public int compare(Task o1, Task 02) { 
if(o1.getPriority()>o2.getPriority()){ 
return -1; 
}else if(o1.getPriority()<02.getPriority() ){ 
return 工 ; 
} 


return 0; 


站 





下 面 来 看 任务 队列 的 示例 代码 : 





Queue<Task> tasks = new PriorityQueue<Task>(11, taskComparator); 
tasks.offer(new Task(20，" 写 日 记 " ) ) ; 
tasks.offer(new Task(10， "看 电视 " ) ) ; 
tasks.offer(new Task(100，" 写 代码 " ) ) ; 
Task task = tasks.poll(); 
while(task!=nul]l){ 

System.out.print(" 处 理 任务 : "+task.getName() 

+"， 优 先 级 :"+task.getPriority()+"\n"); 
task = tasks.poll(); 












































代码 很 简单 ， 束 不 解释 了 ， 输 出 任务 按 优 先 级 排列 : 








处 理 任务 : 写 代 码 ， 优 先 级 :100 
处 理 任务 : 写 日 记 ， 优 先 级 :20 
处 理 任务 : 看 电视 ， 优 先 级 :10 















































11.2.2 ”实现 原理 


理解 了 PriorityQueue 的 用 法 和 特点 ， 我 们 来 看 其 具体 实现 代码 〈 基 
于 Java7) ， 从 内 部 组 成 开始 。 内 部 有 如 下 成 员 : 





private transient Object[] queue 

private int size = 0; 

private final Comparator<? super E> comparator,; 
private transient int modCount = 0; 











queue 就 是 实际 存储 元 素 的 数组 。size 表 示 当 前 元 素 个 数 。 
comparator 为 比较 器 ， 可 以 为 null。modCount 记 录 修 改 次 数 ， 在 介绍 第 
一 个 容器 类 ArrayList 时 已 介绍 过 。 


如 何 实现 各 种 操作 ， 且 保持 堆 的 性 质 呢 ? 我 们 来 看 代码 ， 从 基本 构 
造 方 法 开始 。 


几 个 基本 构造 方法 的 代码 是 : 





public PriorityQueue() { 
this(DEFAULT_INITIAL CAPACITY, null); 


public PriorityQueue(int initialCapacity) { 
this(initialCapacity, null); 


public PriorityQueue(int initialCapacity, 
Comparator<? super E> comparator) { 
if(initialCapacity < 1) 
throw new IllegalArgumentException(); 
this.queue = new Object[initialCcapacity]; 
this.comparator = comparator; 





代码 很 简单 ， 就 是 初始 化 了 queue 和 comparator。 下 面 介绍 一 些 操 作 
的 代码 ， 大 部 分 的 算法 和 图 示 我 们 在 11.1 节 已 经 介绍 过 了 。 


添加 元 素 〈《 入 队 〉 的 代码 如 下 所 示 ， 我 们 添加 了 一 些 注释 : 





public boolean offer(E e) { 

if(e == null) 
throw new NullPpointerException(); 

modCount++， 

int i = size; 

if(i >= queue.length) // 首 先 确 保 数 组 长 度 是 够 的 ， 如 果 不 够 ， 调 用 grow 方 法 动态 扩展 
grow(i + 1); 

size = i + 1; // 增 加 长 度 






















































































if(i == 0) 人 次 添加 ， 直 接 添加 到 第 一 个 位 置 即 可 
0 
else 否则 将 其 放 入 最 后 个 位 置 ， 但 同时 向 上 调整 (siftUp)〉 ， 直 至 满足 堆 的 性 质 















































Se e); 
return true; 


二 一 


有 两 步 复 杂 一 些 ， 一 步 是 grow， 男 一 步 是 siftUp， 我 们 来 细 看 下 。 
grow(〈) 方法 的 代码 为 : 





private void grow(int minCapacity) { 

int oldCapacity = queue.length; 

// Double size if small; else grow by 50% 

int newCapacity = oldCapacity + ((oldCapacity < 64) 
(oldCapacity + 2) : 
(oldcapacity >> 1)); 

// overflow-conscious code 

if(newCapacity - MAX_ARRAY_SIZE > 0) 

newCapacity = hugeCapacity(minCapacity); 
dueue = Arrays.copyof (queue, newCapacity); 





如 采 原 长 度 比较 小 ， 大 概 就 是 扩展 为 两 倍 ， 人 否则 就 是 增加 50%， 使 
用 Arrays.copyOf 方 法 复制 数组 。siftUp 的 基本 思路 我 们 在 11.1 节 介绍 过 
了 ， 其 实际 代码 为 : 





private void siftUp(int k, E x) { 
if(comparator != null) 
siftUpUsingComparator(k, x); 
else 
siftUpComparable(k, x); 





根据 是 否 有 comparator 分 为 了 两 种 情况 ， 代 码 类 似 ， 我 们 只 看 一 
种 : 





private void siftUpUsingComparator(int k, E x) { 
while(k > 0) { 
int parent = (k - 1) >>> 1; 
Object e = queue[parent]; 
if(comparator.compare(x, (E) e) >= 0) 
break; 
queue[k] = e; 
k = parent; 


queue[k] = x; 





参数 k 表 示 插 入 位 置 ，x 表 示 新 元 素 。k 初 始 等 于 数组 大 小 ， 即 在 最 
后 一 个 位 置 插入 。 代 码 的 主要 部 分 是 : 往 上 寻找 x 真正 应 该 插入 的 位 
置 ， 这 个 位 置 用 k 表 示 。 


怎么 找 呢 ? 新 元 素 (X) 不 断 与 父 节 点 〈e) 比较 ， 如 果 新 元 素 
(x) 大 于 等 于 父 节点 (e) ， 则 已 满足 堆 的 性 质 ， 退 出 循环 ，k 就 是 新 
元 素 最 终 的 位 置 ， 否 则 ， 将 父 节 点 往 下 移 〈queue[kj=e) ， 继 续 癌 上 寻 
找 。 这 与 11.1 节 介绍 的 算法 和 图 示 是 对 应 的 。 


查看 头 部 元 际 的 代码 为 : 





public E peek() { 
if(size == 0) 
return null; 
return (E) queue[0]; 





就 是 返回 第 一 个 元 系 。 


删除 头 部 元 素 〈“ 出 队 ) 的 代码 为 : 





public E poll() { 
if(size == 0) 
return null; 
int s = --size; 
modCount++; 
E result = (E) queue[0]; 
E x = (E) queue[s]; 
queue[s] = null; 
if(s != 0) 
SiIftDown(9，X) 
return result 











返回 结果 result 为 第 一 个 元 素 ，x 指 同 最 后 一 个 元 系 ， 将 最 后 位 置 设 
置 为 null (queue[s]=null) ， 最 后 调用 siftDown 将 原来 的 最 后 元 素 x 插 入 
头 部 并 调整 堆 ，siftDown 的 代码 为 : 





private void SiftDown(int k, E x) { 
if(comparator != null) 
siftDownUsingComparator(k, x); 
else 
siftDownComparable(k, x); 





同样 分 为 两 种 情况 ， 代 码 类 似 ， 我 们 只 看 一 种 : 





private void siftDownComparable(int k, E x) { 
Comparable<? super E> key = (Comparable<? super E>)x; 
int half = size >>> 1; //loop while a non-leaf 
while(k < half) { 
int child = (k << 1) + 1; //assume left child is least 
Object c = queue[child]; 
int right = child + 1; 
if(right < size && 
((Comparable<? super E>) c).compareTo((E) queue[right]) > 0) 
c = queue[child = right]; 
if(key.compareTo((E) c) <= 0) 


break; 
queue[k] = c; 
k = child; 


} 
queue[k] = key; 





k 表 示 最 终 的 插入 位 置 ， 初 始 为 0，x 表 示 原 来 的 最 后 元 素 。 代 码 的 
主要 部 分 是 : 同 下 寻找 x 真正 应 该 插入 的 位 置 ， 这 个 位 置 用 k 表 示 。 

怎么 找 昵 ? 新 元 素 key 不 断 与 较 小 的 孩子 节点 比较 ， 如 果 小 于 等 于 
较 小 的 孩子 市 扩 ， 则 已 满足 堆 的 性 质 ， 退 出 循环 ，k 束 是 最 终 位 置 ， 盏 
则 将 较 小 的 孩子 节点 往 上 移 ， 继 续 同 下 寻找 。 这 与 11.1 节 介绍 的 算法 和 
图 示 也 是 对 应 的 。 

解释 下 其 中 的 一 些 代 码 : 


1) k<halt 表 示 编号 为 k 的 节点 有 孩子 节点 ， 没 有 孩子 节点 ， 就 不 需 
要 继续 找 了 


2) child 表 示 较 小 的 孩子 节点 编号 ， 初 始 为 左 孩 子 ， 如 果 有 右 孩 子 
(编号 right〉 且 小 于 左 孩 子 则 child 会 变 为 right; 


3) c 表 示 较 小 的 孩子 节点 。 
根据 值 删除 元 系 的 代码 为 : 




















public boolean remove(Object o) { 
int i = indexof(o); 
if(i == -1) 
return false; 
else { 
removeAt (i); 
return true; 
} 
} 





先 查 找 元 素 的 位 置 1， 然 后 调用 removeAt 进 行 删 除 ，removeAt 的 代 
码 为 : 





private E removeAt(int i) { 
assert i >= 0 && i < size; 
modCount++; 
int s = --size; 
if(s == i) // removed last element 
queue[i] = null; 
else { 
E moved = (E) queue[s]' 
queue[s] = null; 
siftDown(i, moved); 
if(queue[i] == moved) { 
siftUp(i, moved); 
if(queue[i] != moved) 
return moved; 


} 


return null; 





如 果 是 删除 最 后 一 个 位 置 ， 直 接 删 即 可 ， 人 否则 移动 最 后 一 个 元 素 到 
位 置 1 并 进行 堆 调 整 ， 调 整 有 两 种 情况 ， 如 果 大 于 孩子 节点 ， 则 癌 下 调 
整 ， 否 则 如 果 小 于 父 市 点 则 同上 调整 。 代 码 先 同 下 调整 (siftDown (ji 
moved) ) ， 如 果 没 有 调整 过 (gueue[li]==moved) ， 可 能 需 向 上 调整 ， 
调用 siftUp (i，moved) 。 如 果 回 上 调整 过 ， 返 回 值 为 noved， 其 他 情 
况 返回 null， 这 个 主要 用 于 正确 实现 PriorityQueue 和 迭代 器 的 删除 方法 ， 
友 代 堪 的 细节 我 们 束 不 介绍 了 。 


如 果 从 一 个 既 不 是 PriorityQueue 也 不 是 SortedSet 的 容器 构造 堆 ， 代 
人 码 为 : 





private void initFromCollection(Collection<? extends E> c) { 
initElementsFromCollection(c); 
heapify(); 





initElementsFromCollection 的 主要 代码 为 : 





private void initElementsFromCollection(Collection<? extends E> c) { 
Object[] a = c.toArray(); 
if(a.getclass() != Object[].class) 
a = Arrays.copyof(a, a.length, Object[].class); 


this. queue = a; 
this.size = a. length; 


} 





要 是 初始 化 queue 和 size。heapify 的 代码 为 : 





private void heapify() { 
for(int i = (Size >>> 1) - 1; i >= 0; i--) 
siftDown(i, (E) queue[i]); 
} 





与 之 前 算法 一 样 ，heapify 也 在 11.1 节 介绍 过 了 ， 就 是 从 最 后 一 个 非 
叶子 节点 开始 ， 目 底 癌 上 合并 构建 堆 。 如 果 钩 迁 记 法 牛 的 寡 数 是 
PriorityQueue 或 SortedSet， 则 它们 的 toArray 方 法 返回 的 数组 承 是 有 序 
的 ， 就 满足 堆 的 性 质 ， 就 不 需要 执行 heapify 了 。 


la We 
本 节 介 绍 了 Java 中 堆 的 实现 类 PriorityQueue， 它 实现 了 队列 接口 
Queue， 但 按 优先 级 出 队 ， 内 部 是 用 堆 实 现 的 ， 有 如 下 特点 : 


ey 最 先 出 队 的 总 是 优先 级 最 高 的 ， 即 排序 中 
J 第 一 个 。 


2) 优先 级 可 以 有 相同 的 ， 内 部 元 又 不 是 完全 有 序 的 ， 如 末 届 历 输 
出 ， 除 了 第 一 个 ， 其 他 没有 特定 顺序 。 


3) 查看 头 部 元 素 的 效率 很 高 ， 为 O (1) ， 入 队 、 出 队 效率 比较 
高 ， 为 O (log。(N) ) ， 构 建 堆 heapify 的 效率 为 O CN) 。 


4) 根据 值得 找 和 删除 元 素 的 效率 比较 低 ， 为 O CN) 。 


除了 用 作 基 本 的 优先 级 队列 ，PriorityQueue 还 可 以 作为 一 种 比较 通 
用 的 数据 结构 ， 用 于 解决 一 些 其 他 问题 ， 让 我 们 在 下 一 节 继 续 探讨 。 








11.3 ” 扒 和 PriorityQueue 的 应 用 


PriorityQueue 除 了 用 作 优 先 级 队列 ， 还 可 以 用 来 解决 一 些 别 的 问 
题 ， 本 章 开 头 提 到 了 如 下 两 个 应 用 。 


1) 求 前 K 个 最 大 的 元 素 ， 元 素 个 数 不 确 定 ， 数 据 量 可 能 很 大 ， 甚 
至 源源 不 断 到 来 ， 但 需要 知道 到 目前 为 止 的 最 大 的 前 K 个 元 素 。 这 个 问 
的 元素。 


2) 求 中 值 元 素 ， 中 值 不 是 平均 值 ， 而 是 排序 后 中 间 那 个 元 系 的 
值 ， 同 样 ， 数 据 量 可 能 很 大 ， 甚 至 源源 不 断 到 来 。 


本 节 ， 我 们 就 来 探讨 如 何 解决 这 两 个 问题 。 











11.3.1 求 前 K 个 最 大 的 元 素 


一 个 简单 的 思路 是 排序 ， 排 序 后 取 最 大 的 K 个 就 可 以 了 ， 排 序 可 以 
使 用 Arrays.sort〈) 方法 ， 效 率 为 O (Nxlog，(N) ) 。 不 过 ， 如 果 K 很 
小 ， 比 如 是 1， 就 是 取 最 大 值 ， 对 所 有 元 又 完全 排序 是 宣 无 必要 的 。 另 
一 个 简单 的 思路 是 选择 ， 循 环 选择 K 次 ， 每 次 从 剩 下 的 元 素 中 选择 最 大 
值 ， 这 个 效率 为 O(NxK) ， 如 果 K 的 值 大 于 log。 (CN) ， 这 个 就 不 如 完 
全 排序 了 。 


不 过 ， 这 两 个 思路 都 假定 所 有 元 和 聚 都 是 已 知 的 ， 而 不 是 动态 添加 
的 。 如 果 元 系 个 数 不 确 定 ， 且 源源 不 断 到 来 呢 ? 


一 个 基本 的 思路 是 维护 一 个 长 度 为 K 的 数组 ， 节 前面 的 K 个 元 系 就 
是 目前 最 大 的 K 个 元 系 ， 以 后 每 来 一 个 新 元 系 的 时 候 ， 都 先 找 数组 中 的 
最 小 值 ， 将 新 元 素 与 最 小 值 相 比 ， 如 果 小 于 最 小 值 ， 则 什么 都 不 用 变 ， 
如 果 大 于 最 小 值 ， 则 将 最 小 值 蔡 换 为 新 元 么 。 


这 有 点 类 似 于 生活 中 的 末 位 淘汰 ， 新 元 象 与 原来 最 末尾 的 比 即 可 ， 
要 么 不 如 最 末尾 ， 上 不 去 ， 要 么 丛 挥 原来 的 末尾 。 
































这 样 ， 数 组 中 维护 的 永远 是 最 大 的 K 个 元 素 ， 而 且 不 管 源 数据 有 多 
少 ， 需 要 的 内 存 开销 是 固定 的 ， 束 是 长 度 为 K 的 数组 。 不 过 ， 每 来 一 个 
元 素 ， 都 需要 找 最 小 值 ， 都 需要 进行 K 次 比较 ， 能 不 能 减少 比较 次 数 
呢 ? 


解决 方法 是 使 用 最 小 堆 维护 这 K 个 元 素 ， 最 小 堆 中 ， 根 即 第 一 个 元 
素 永远 都 是 最 小 的 ， 新 来 的 元 素 与 根 比 就 可 以 了 ， 如 果 小 于 根 ， 则 堆 不 
需要 变化 ， 否 则 用 新 元 素 人 替换 根 ， 然 后 向 下 调整 堆 即 可 ， 调 整 的 效率 为 
O(log。(K) ) ， 这 样 ， 总 体 的 效率 就 是 DO 〈Nxlog(K) ) ， 这 个 效 
率 非常 高 ， 而 且 存储 成 本 也 很 低 。 


使 用 最 小 堆 之 后 ， 第 K 个 最 大 的 元 系 也 很 容易 获得 ， 它 就 是 堆 的 

















根 。 


理解 了 思路 ， 下 面 我 们 来 看 代码 。 我 们 实现 一 个 简单 的 TopK 类 ， 
如 代码 清单 11-1 所 示 。 


代码 清单 11-1 求 前 K 个 最 大 的 元 素 : TopK 





public class TopK <E> { 
private PriorityQueue<E> p; 
private int k; 
public TopK(int K){ 
this.k = k; 
this.p = new PriorityQueue<>(k); 


} 
public void addAll(Collection<? extends E> c){ 
for(E e : c){ 
add(e); 


} 
public void add(E e) { 
if(p.size()<k){ 
p.add(e); 
return; 


Comparable<? super E> head = (Comparable<? super E>)p.peek(); 
if(head.compareTo(e)>0){ 

// 小 于 TopK 中 的 最 小 值 ， 不 用 变 

return; 




















了 

// 新 元 素 蔡 换 掉 原 来 的 最 小 值 成 为 TopK 之 一 
p.poll(); 

p.add(e); 


} 
public <T> T[] toArray(T[] a)t{ 
return p.toArray(a); 


} 
public E getkth(){ 


return p.peek(); 
} 
} 





我 们 稍微 解释 一 下 。TopK 内 部 使 用 一 个 优先 级 队列 和 k， 构 造 方法 
接受 一 个 参数 k， 使 用 PriorityQueue 的 默认 构造 方法 ， 假 定 元 素 实现 了 
Comparable 接 口 。 





add 方 法 实现 同 其 中 动态 添加 元 素 ， 如 果 元 素 个 数 小 于 k 直 接 添加 ， 
否则 与 最 小 值 比 较 ， 只 在 大 于 最 小 值 的 情况 下 添加 ， 添 加 前 ， 先 删 掉 原 
来 的 最 小 值 。addAll 方 法 循环 调用 add 方 法 。 


toArray 方 法 返回 当前 的 最 大 的 K 个 元 素 ，getKth 方 法 返回 第 K 个 最 
大 的 元 素 。 


我 们 来 看 一 下 使 用 的 例子 : 





TopK<Integer> top5 = new TopKk<>(5); 
top5.addAll(Arrays.asList(new Integer[]{ 

100, 1, 2, 5, 6, 7, 34, 9, 3, 4, 5, 8, 23, 21, 90, 1, 0 
})); 
System,out.println(Arrays,toString(top5.toArray(new Integer[0]))); 
System,.out.println(top5.getkth()); 





保留 5 个 最 大 的 元 素 ， 输 出 为 : 





[21, 23, 34, 100, 90] 
21 





代码 比较 人 简单 ， 束 不 解释 了 。 


11.3.2 求 中 值 








中 值 束 是 排序 后 中 间 那 个 元 素 的 值 ， 如 果 元 素 个 数 为 奇数 ， 中 值 是 
没有 此 义 的 ， 但 如 果 是 偶数 ， 中 值 可 能 有 不 同 的 定义 ， 可 以 为 偶 小 的 那 
个 ， 也 可 以 是 偏 大 的 那个 ， 或 者 两 者 的 平均 值 ， 或 者 任意 一 个 ， 这 里 ， 
我 们 假定 任意 一 个 都 可 以 。 


一 个 简单 的 思路 是 排序 ， 排 序 后 取 中 间 那 个 值 就 可 以 了 ， 排 序 可 以 
使 用 Arrays.sort《〈) 方法 ， 效 率 为 O CNxlog CN) ) 。 








不 过 ， 这 要 求 所 有 元 对 都 是 已 知 的， 而 不 是 动态 添加 的 。 如 果 元 系 
源源 不 断 到 来 ， 如 何 实时 得 到 当前 已 经 输入 的 元 素 序 列 的 中 位 数 ? 


可 以 使 用 两 个 堆 ， 一 个 最 大 堆 ， 一 个 最 小 堆 ， 思 路 如 下 。 


1) 假设 当前 的 中 位 数 为 mn， 最 大 堆 维 护 的 是 <=m 的 元 素 ， 最 小 堆 维 
护 的 是 >=m 的 元 素 ， 但 两 个 堆 都 不 包含 m。 


2) 当 新 的 元 素 到 达 时 ， 比 如 为 e， 将 e 与 mm 进行 比较 ， 知 e<=m， 则 
将 其 加 入 最 大 堆 中 ， 人 否则 将 其 加 入 最 小 堆 中 。 

3) 第 2 步 后 ， 如 果 此 时 最 小 堆 和 最 大 堆 的 元 素 个 数 的 差 值 >=2， 则 
将 m 加 入 元 素 个 数 少 的 堆 中 ， 然 后 从 元 素 个 数 多 的 堆 将 根 节 点 移 除 并 赋 


值 给 m。 


我 们 通过 一 个 例子 来 解释 下 。 比 如 输入 元 素 依次 为 : 





34, 90, 67, 45,1 


输入 第 1 个 元 素 时 ，m 即 为 34。 


人 90 大 于 34， 加 入 最 小 堆 ， 中 值 不 变 ， 如 图 11-20 
示 。 


,区 





图 11-20 求 中 值 ， 输 入 第 2 个 元 素 后 


输入 第 3 个 元 素 时 ，67 大 于 34， 加 入 最 小 堆 ， 但 加 入 最 小 堆 后 ， 
小 堆 的 元 系 个 数 为 2， 需 调整 中 值 和 堆 ， 现 有 中 值 34 加 入 最 大 堆 中 ， 
小 堆 的 根 67 从 最 小 堆 中 删除 并 赋值 给 m， 如 图 11-21 所 示 。 


油 泪 





最 大 堆 最 小 堆 | 最 大 堆 最 小 堆 
: 67 > 34 |! 90 | 
z EE 1! 
: @ : : 


图 11-21 求 中 值 ， 输入 第 三 个 元 素 后 


输入 第 4 个 元 素 45 时 ，45 小 于 67， 加 入 最 大 堆 ， 中 值 不 变 ， 如 图 11- 
22 所 示 。 


' 最 大 堆 最 小 堆 
45 90 1! 
WB. ' 
@ : 


图 11-22 求 中 值 ， 输入 第 四 个 元 素 后 
输入 第 5 个 元 素 1 时 ，1 小 于 67， 加 入 最 大 堆 ， 此 时 需 调整 中 值 和 


推 ， 现 有 中 值 67 加 入 最 小 堆 中 ， 最 大 扒 的 根 45 从 最 大 堆 中 删除 并 赋值 给 
m， 如 图 11-23 所 示 。 


， 最 大 堆 最 小 堆 ， 最 大 堆 最 小 堆 | 
| 90 => 34 ; | 
| 人 | 
证 有 局 ' 全 ! 190 


图 11-23 求 中 值 ， 输入 第 五 个 元 素 后 


理解 了 基本 思路 ， 我 们 来 实现 一 个 简单 的 中 值 类 Median， 如 代码 清 
单 11-2 所 示 。 


代码 清单 11-2 求 中 值 ，Median 





public class Median <E> { 
private PriorityQueue<E> minP; // 最 小 堆 
private PriorityQueue<E> maxP; // 最 大 堆 
private E m; // 当 前 中 值 
public Median(){ 
this,minP = new PriorityQueue<>(); 
this.maxP = new PriorityQueue<>(11, Collections.reverseOrder()); 





























} 


private int compare(E e, E m){ 
Comparable<? super E> cmpr = (Comparable<? super E>)e; 
return cmpr.compareTo(m); 


} 
public void add(E e){ 
if(m==null){ // 第 一 个 元 素 
m= ee; 
return; 
} 
if(compare(e, m)<=0){ 
// 小 于 中 值 ， 加 入 最 大 堆 
maxP.add(e); 
}elsef{ 
minP.add(e); 

















if(minP.size()-maxP.size( )>=2){ 
// 最 小 堆 元 素 个 数 多 ， 即 大 于 中 值 的 数 多 
// 将 m 加 入 到 最 大 堆 中 ， 然 后 将 最 小 堆 中 的 根 移 除 赋 给 m 

















maxP.add(this.m); 
this.m = minP.poll(); 
}else if(maxP.size()-minp.size()>=2){ 
minP.add(this.m); 
this.m = maxP.poll(); 
} 


} 
public void addAll(Collection<? extends E> c){ 
for(E e : c){ 
add(e); 


} 
public E getM() { 
return m; 
} 
} 





代码 和 思路 基本 是 对 应 的 ， 比 较 人 简单 ， 束 不 解释 了 。 我 们 来 看 一 个 
使 用 的 例子 : 





Median<Integer> median = new Median<>(); 

List<Integer> list = Arrays.asList(new Integer[]{ 
34, 90, 67, 45, 1, 4, 5, 6, 7, 9, 10 

}); 

median.addAll(1ist); 

System.out.println(median.getM()); 





输出 为 中 值 9。 
11.33 小 全 


本 节 介 绍 了 堆 和 PriorityQueue 的 两 个 应 用 ， 求 前 K 个 最 大 的 元 素 和 
求 中 值 ， 介 绍 了 基本 思路 和 实现 代码 ， 相 比 使 用 排序 ， 使 用 堆 不 仅 实 现 
2 而 且 可 以 应 对 数据 量 不 确定 且 源 源 不 断 到 来 的 情况 ， 可 以 给 
出 实 下 结 


之 前 章节 我 们 还 介绍 过 ArrayDeque。PriorityQueue 和 ArrayDeque 都 
是 队列 ， 都 是 基于 数组 的 ， 但 都 不 是 简单 的 数组 ， 通 过 一 些 特殊 的 约 
束 、 辅 助 成 员 和 算法 ， 它 们 都 能 高 效 地 解决 一 些 特定 的 问题 ， 这 大 概 是 
计算 机 程序 中 使 用 数据 结构 和 算法 的 一 种 艺术 吧 。 


至 此 ， 关 于 堆 的 概念 与 算法 、 优 先 级 队列 PriorityQueue 及 其 应 用 ， 
就 介绍 完了 。 之 前 的 章节 中 ， 我 们 介绍 的 基本 都 是 具体 的 容器 类 ， 下 一 





章 ， 我 们 看 一 些 抽 象 容 占 类 ， 以 及 针对 容 絮 接口 的 通用 功能 ， 并 对 整个 
容 吉 类 体系 进行 总 结 。 


第 12 半 通用 容 如 类 和 忌 结 


之 前 的 章节 中 ， 我 们 介绍 的 都 是 具体 的 容 需 类 ， 本 章 介 绍 一 些 抽象 
容 需 类 、 一 些 通用 的 算法 和 功能 ， 并 对 整个 容器 类 体系 进行 梳理 总 纺 。 


之 前 介绍 的 具体 容器 类 其 实 都 不 是 从 头 构建 的 ， 它 们 都 继承 了 一 些 
抽象 容器 类 。 这 些 抽象 类 提供 了 容器 接口 的 部 分 实现 ， 方 便 了 Java 具 体 
容器 类 的 实现 。 此 外 ， 通 过 继承 抽象 类 ， 自 定义 的 类 也 可 以 更 为 容易 地 
实现 容器 接口 。 为 什么 需要 实现 容器 接口 呢 ? 至 少 有 两 个 原因 。 


1) 容器 类 是 一 个 大 家 寿 ， 它 们 之 间 可 以 方便 地 协作 ， 比 如 很 多 方 
法 的 参数 和 返回 值 都 是 容器 接口 对 象 ， 实 现 了 容 需 接口， 就 可 以 方便 地 
参与 这 种 协作 。 


2) Java 有 一 个 类 Collections， 提 供 了 很 多 针对 容 占 接口 的 通用 算法 
和 功能 ， 实 现 了 容 右 接口 ， 可 以 直接 利用 Collections 中 的 算法 和 功能 。 


本 间 首 先 介 绍 抽象 容器 类 ， 人 然后 介绍 Collections 中 的 通用 功能 ， 最 
后 对 整个 容器 类 体系 进行 梳理 总 结 。 





























12.1 抽象 容器 类 


抽象 容 絮 类 与 之 前 介绍 的 接口 和 具体 容 强 类 的 关系 如 图 12-1 所 示 。 








虚线 框 表示 接口 ， 有 Collection、List、Set、Queue、Deque 和 Map。 
有 6 个 抽象 容器 类 。 


1) AbstractCollection: 实现 了 Collection 接 口 ， 被 抽象 类 
AbstractList、AbstractSet、AbstractQueue 继 承 ，ArrayDeque 也 继承 自 
AbstractCollection 〈 图 中 未 画 出 ) 。 


2) AbstractList: 父 类 是 AbstractCollection， 实 现 了 List 接 口 ， 被 
ArrayList、Abstract-SequentialList 继 承 。 















AN 


ArrayList ||LinkedList || HashSet | | TreeSet| | EnumSet 


图 12-1 容器 类 体系 与 抽象 容器 类 


3) AbstractSequentialList: 父 类 是 AbstractList， 被 LinkedList 继 承 。 








4) AbstractMap: 实现 了 Map 接 口 ， 被 TreeMap、HashMap、 
EnumMap 继 承 。 


5) AbstractSet: 父 类 是 AbstractCollection， 实 现 了 Set 接 口 ， 被 
HashSet、TreeSet 和 EnumSet 继 承 。 


6) AbstractQueue: 父 类 是 AbstractCollection， 实 现 了 Queue 接 口 ， 
被 PriorityQueue 继 承 。 


下 和 面 ， 我 们 分 别 来 介绍 这 些 抽象 类 ， 包 括 它 们 提供 的 基础 功能 、 如 
何 实现 、 如 何 进行 扩展 等 ， 代 码 分 析 基 于 Java 7。 


12.1.1 AbstractCollection 





AbstractCollection 提 供 了 Collection 接 口 的 基础 实现 ， 具 体 来 说 ， 它 
实现 了 如 下 方法 : 





public boolean addAll(Collection<? extends E> c) 
public boolean contains(Object 0) 

public boolean containsAll(Collection<?> c) 
public boolean isEmpty() 

public boolean remove(Object 0o) 

public boolean removeAll(Collection<?> c) 
public boolean retainAll(Collection<?> c) 
public void clear() 

public Object[] toArray() 

public <T> T[] toArray(T[] a) 

public String toString() 





AbstractCollection 又 不 知道 数据 是 怎么 存储 的 ， 它 是 如 何 实现 这 些 
方法 的 呢 ? 它 依 赖 于 如 下 更 为 基础 的 方法 : 








public boolean add(E e) 
public abstract int size(); 
public abstract Iterator<E> iterator(); 





add 方 法 的 默认 实现 是 : 





public boolean add(E e) { 
throw new UnsupportedOoperationException(); 
} 








抛 出 “操作 不 支持 ”异常 ， 如 果子 类 集合 是 不 可 被 修 改 的 ， 这 个 默认 





实现 就 可 以 了 ， 和 否则， 必须 重 写 add 方 法 。addAll 方 法 的 实现 就 是 循环 调 
用 add 方 法 。 





Size 方法 是 抽象 方法 ， 子 类 必须 重 写 。 ns 法 就 是 检查 size 方 
法 的 返回 值 是 否 为 0。toArray 方 法 依赖 size 方 法 的 返回 值 分 配 数 组 大 小 。 


iterator 方 法 也 是 抽象 方法 ， 它 返回 一 个 实现 了 迭代 此 接口 的 对 象 ， 
子 类 必须 重 写 。 我 们 知道 ， 友 代 堪 定义 了 三 个 方法 : 





boolean hasNext( ) ， 
E next(); 
void remove(); 





如 果子 类 集合 是 不 可 被 修改 的 ， 和 迭代 器 不 用 实现 remove 方 法 ， 
则 ， 三 个 方法 都 必须 实现 。 


AbstractCollection 中 的 大 部 分 方法 都 是 基于 迭代 器 的 方法 实现 的 ， 
比如 contains 方 法 ， 其 代码 为 : 





public boolean contains(Object o) { 
Iterator<E> it = iterator(); 
if(o==null) { 
while(it.hasNext()) 
if(it.next()==null) 
return true; 
} else { 
while(it.hasNext()) 
if(o.equals(it.next())) 
return true; 


return false; 





通过 达 代 器 方法 循环 进行 比较 。 


除了 接口 中 的 方法 ，Collection 接 口 文档 建议 ， 每 个 Collection 接 口 
的 实现 类 都 应 该 提供 至 少 两 个 标准 的 构造 方法 ， 一 个 是 默认 构造 方法 ， 
另 一 个 接受 一 个 Collection 类 型 的 参数 。 


具体 如 何 通 过 继承 AbstractCollection 来 实现 自 定 义 容 器 呢 ? 我 们 通 
过 一 个 简单 的 例子 来 说 明 。 ] 使 用 在 8.1 节 自己 实现 的 动态 数组 容器 
类 DynamicArray 来 实现 一 个 简单 的 Collection 。 








DynamicArray 当 时 没有 实现 根据 索引 添加 和 删除 的 方法 ， 我 们 先 来 
补充 一 下 ， 如 代码 清单 12-1 所 示 。 


代码 清单 12-1 添加 方法 后 的 DynamicArray 





public class DynamicArray<E> { 
XA 
public E remove(int index) { 
E oldValue = get(index); 
int numMoved = size - index - 1; 
if(numMoved > 0) 
System.arraycopy(elementData, index + 1, elementData, index, 
numMoved ) ; 
elementData[--size] = nu]1， 
return oldvValue; 
} 
public void add(int index, E element) { 
ensureCapacity(size + 1); 
System.arraycopy(elementData, index, elementData, index + 1, 
size - index); 
elementData[index] = element; 
Size++; 





基于 DynamicArray， 我 们 实现 一 个 简单 的 迭代 器 类 
DynamicArrayIterator， 如 代码 清单 12-2 所 示 。 


代码 清单 12-2 一 个 简单 的 迭代 器 类 DynamicArraylterator 





public class DynamicArrayIterator<E> implements Iterator<E>{ 
DynamicArray<E> darr; 
int cursor; 
int lastRet = -1; 
public DynamicArrayIterator(DynamicArray<E> darr){ 
this.darr = darr,; 


} 
Q@Override 
public boolean hasNext() { 
return cursor != darr.size(); 
Q@Override 


public E next() { 
int i = cursor; 
if(i >= darr.size()) 
throw new NoSuchElementException(); 
cursor = 工 + 工 
lastRet = 工 ; 
return darr.get(i); 
} 
@Override 
public void remove() { 


if(lastRet < 0) 
throw new IllegalSstateException(); 
darr.remove(lastRet); 
cursor = lastRet,; 
lastRet = -1; 








代码 很 简单 ， 束 个 解 释 了， 为 简 音 起见， 我 们 没有 实现 实际 容 絮 类 
中 的 有 关 检 测 结构 性 变化 的 逻辑 。 
基于 DynamicArray 和 DynamicArraylterator， 通 过 继承 


AbstractCollection， 我 们 来 实现 一 个 简单 的 容器 类 MyCollection， 如 代码 
清单 12-3 所 示 。 


代码 清单 12-3 一 个 简单 的 容器 类 MyCollection 








public class MyCollection<E> extends AbstractCollection<E> { 
DynamicArray<E> darr; 
public MyCollection(){ 
darr = new DynamicArray<>(); 


public MyCollection(Collection<? extends E> c){ 
this(); 
addAll(c); 


Q@Override 
public Iterator<E> iterator() { 

return new DynamicArrayIterator<>(darr); 
} 


Q@Override 

public int size() { 
return darr.size(); 

} 


Q@Override 

public boolean add(E e) { 
darr.add(e); 
return true; 





代码 很 简单 ， 束 是 按 建 议 提 供 了 两 个 构造 方法 ， 并 重 写 了 size、add 
和 iterator 方 法 ， 这 些 方法 内 部 使 用 了 DynamicArray 和 
DynamicArrayIterator。 


12.1.2 AbstractList 





AbstractList 提 供 了 List 接 口 的 基础 实现 ， 有 具体 来 说 ， 它 实现 了 如 下 
方法 : 





public boolean add(E e) 

public boolean addAll(int index, Collection<? extends E> c) 
public void clear() 

public boolean equals(Object 0) 

public int hashCode() 

public int indexof(Object 0o) 

public Iterator<E> iterator() 

public int lastIindexof (Object o) 

public ListIterator<E> listIterator() 

public ListIterator<E> listIterator(final int index) 
public List<E> subList(int fromIndex, int toIndex) 








AbstractList 是 怎么 实现 这 些 方法 的 呢 ? 它 依赖 于 如 下 更 为 基础 的 方 
法 : 





public abstract int size(); 

abstract public E get(int index); 
public E set(int index, E element) 
public void add(int index, E element) 
public E remove(int index) 





size 方 法 与 AbstractCollection 一 样 ， 也 是 抽象 方法 ， 子 类 必须 重 写 。 
get 方 法 根据 索引 index 获 取 元 素 ， 它 也 是 抽象 方法 ， 子 类 必须 重 写 。 


set、add、remove 方 法 都 是 修改 容器 内 容 ， 它 们 不 是 抽象 方法 ， 但 
默认 实现 都 是 抛 出 异常 UnsupportedOperationException。 如 果子 类 容器 
不 可 被 修改 ， 这 个 默认 实现 束 可 以 了 。 如 果 可 以 根据 索引 修改 内 容 ， 应 
该 重 写 set 方 法 。 如 果 容 器 是 长 度 可 变 的， 应 该 重 写 add 和 remove 方 法 。 











与 AbstractCollection 不 同 ， 继 承 AbstractList 不 需要 实现 迭代 器 类 和 
相关 方法 ，AbstractList 内 部 实现 了 两 个 迭代 右 类 ， 一 个 实现 了 Iterator 接 
口 ， 另 一 个 实现 了 ListIterator 接 口 ， 它 们 是 基于 以 上 的 这 些 基础 方法 实 
现 的 ， 逻 辑 比较 简单 ， 束 不 葡 述 了 。 


具体 如 何 扩展 AbstractList 呢 ? 我 们 来 看 个 例子 ， 也 通过 
DynamicArray 来 实现 一 个 简单 的 List， 如 代码 清单 12-4 所 示 。 








代码 清单 12-4 扩展 AbstractList 的 List 实 现 





public class MyList<E> extends AbstractList<E> { 
private DynamicArray<E> darr; 
public MyList(){ 
darr = new DynamicArray<>(); 


public MyList(Collection<? extends E> c){ 
this(); 
addAll(c); 


Q@Override 
public E get(int index) { 
return darr.get(index); 


Q@Override 

public int size() { 
return darr.size(); 

} 


Q@Override 
public E set(int index, E element) { 
return darr.set(index, element); 


Q@Override 
public void add(int index, E element) { 
darr.add(index, element); 


Q@Override 

public E remove(int index) { 
return darr.remove(index); 

} 





代码 很 简单 ， 就 是 按 建议 提供 了 两 个 构造 方法 ， 并 重 写 了 size、 
get、set、add 和 remove 方 法 ， 这 些 方法 内 部 使 用 了 DynamicArray。 


12.1.3 Abstract9equentialList 


AbstractSequentialList 是 AbstractList 的 子 类 ， 也 提供 了 List 接 口 的 基 
础 实现 ， 具 体 来 说 ， 它 实现 了 如 下 方法 : 





public void add(int index, E element) 

public boolean addAll(int index, Collection<? extends E> c) 
public E get(int index) 

public Iterator<E> iterator() 

public E remove(int index) 

public E set(int index, E element) 








可 以 看 出 ， 它 实现 了 根据 索引 位 置 进行 操作 的 get、set、add、 
remove 方 法 ， 它 是 怎么 实现 的 呢 ? 它 是 基于 ListIterator 接 口 的 方法 实现 
的 ， 在 AbstractSequentialList 中 ，listIterator 方 法 被 重 写 为 了 一 个 抽象 方 





法 : 





public abstract ListIterator<E> listIterator(int index) 





子 类 必须 重 写 该 方法 ， 并 实现 达 代 器 接口 。 


我 们 来 看 段 具 体 的 代码 ， 看 get、set、add、remove 是 如 何 基于 
ListIterator 实 现 的 。get 方 法 代码 为 : 





public E get(int index) { 
try { 
return listIiterator(index).next(); 
} catch (NoSuchElementException exc) 
throw new IndexOutOofBoundsException("Index: "+index); 
} 


} 





代码 很 简单 ， 其 他 方法 也 都 类 似 ， 就 不 痪 述 了 。 


注意 与 AbstractList 相 区 别 ， 可 以 说 ， 虽 然 AbstractSequentialList 是 
AbstractList 的 子 类 ， 但 实现 逻辑 和 用 法 上 ， 与 AbstractList 正 好 相反 。 


.AbstractList 需 要 具体 子 类 重 写 根据 索引 操作 的 方法 get、set、add、 
remove， 它 提供 了 达 代 占 ， 但 从 代 器 是 基于 这 些 方法 实现 的 。 它 假定 子 
类 可 以 高 效 地 根据 索引 位 置 进行 操作 ， 适 用 于 内 部 是 随机 访问 类 型 的 存 
储 结构 〈 如 数组 ) ， 比 如 ArrayList 就 继承 自 AbstractList。 


AbstractSequentialList 需 要 具体 子 类 重 写 迭代 器 ， 它 提供 了 根据 索 
引 操 作 的 方法 get、set、add、remove， 但 这 些 方法 是 基于 迭代 器 实现 
的 。 它 适用 于 内 部 是 顺序 访问 类 型 的 存储 结构 〈 如 链表 ) ， 比 如 
LinkedList 束 继承 目 AbstractSequentialList。 














具体 如 何 扩展 AbstractSequentialList 呢 ? 我 们 还 是 以 DynamicArray 举 
例 来 说 明 ， 在 实际 应 用 中 ， 如 有 果 内 部 存储 结构 类 似 DynamicArray， 应 该 
继承 AbstractList， 这 里 主要 是 演示 其 用 法 。 


扩展 AbstractSequentialList 需 要 实现 ListIterator， 前 面 介 绍 的 
DynamicArrayIterator 只 实现 了 Iterator 接 口 ， 通 过 继承 
DynamicArrayIterator， 我 们 实现 一 个 新 的 实现 了 List-Iterator 接 口 的 类 


DynamicArrayListIterator， 如 代码 清单 12-5 所 示 。 


代码 清单 12-5 ”实现 了 ListIterator 接 口 的 类 DynamicArrayListIterator 





public class DynamicArrayListIterator<E> 
extends DynamicArrayIterator<E> implements ListIterator<E>{ 
public DynamicArrayListIterator(int index, DynamicArray<E> darr){ 
super(darr); 
this.cursor = index; 


Q@Override 

public boolean hasPrevious() { 
return cursor > 0; 

} 


Q@Override 
public E previous() { 
if(!hasPprevious()) 
throw new NoSuchElementException(); 
cursor--; 
lastRet = cursor; 
return darr.get(lastRet); 


Q@Override 
public int nextIndex() { 
return cursor; 


Q@Override 

public int previousIndex() { 
return cursor - 1; 

} 


@Override 
public void set(E e) { 
if(lastRet==-1){ 
throw new IllegalStateException(); 


darr.set(lastRet, e); 


Q@Override 

public void add(E e) { 
darr.add(cursor, e); 
CuUrsort++; 
lastRet = -1; 





逻辑 比较 简单 ， 就 不 解释 了 。 有 了 DynamicArrayListIterator， 我 们 
看 基于 Abstract-SequentialList 的 List 实 现 ， 如 代码 清单 22-6 所 示 。 


代码 清单 12-6 ”基于 AbstractSequentialList 的 List 实 现 





public class MySeqList<E> extends AbstractSequentialList<E> { 
private DynamicArray<E> darr; 


public MySeqList(){ 
darr = new DynamicArray<>(); 


public MySeqList(Collection<? extends E> c){ 
this(); 
addAll(c); 


Q@Override 
public ListIterator<E> listIterator(int index) { 
return new DynamicArrayListIterator<>(index, darr); 


Q@Override 

public int size() { 
return darr.size(); 

} 





代码 很 简单 ， 就 是 按 建议 提供 了 两 个 构造 方法 ， 并 重 写 了 size 和 
listIterator 方 法 ， 迭 代 器 的 实现 是 DynamicArrayListIterator。 


12.1.4 AbstractMap 





AbstractMap 提 供 了 Map 接 口 的 基础 实现 ， 有 具体 来 说 ， 它 实现 了 如 下 
方法 : 





public void clear() 

public boolean containsKey(Object key) 
public boolean containsValue(Object value) 
public boolean equals(Object 0o) 

public V get(Object key) 

public int hashCode() 

public boolean isEmpty() 

public Set<K> keySet() 

public void putAll(Map<? extends K, ? extends V> m) 
public V remove(Object key) 

public int size() 

public String toString() 

public Collection<V> values() 





AbstractMap 是 如 何 实现 这 些 方法 的 呢 ? 它 依赖 于 如 下 更 为 基础 的 
7 





public V put(K key, V value) 
public abstract Set<Entry<K,V>> entrySet(); 





putAl 就 是 循环 调用 put。put 方 法 的 默认 实现 是 抛 出 异 向 





UnsupportedOperation-Exception， 如 果 Map 是 允许 写 入 的 ， 则 需要 重 写 


其 他 方法 都 基于 entrySet 方 法 。entrySet 方 法 是 一 个 抽象 方法 ， 子 类 
必须 重 写 ， 它 返回 所 有 键 值 对 的 Set 视 图 ， 如 果 Map 是 允许 删除 的 ， 这 个 
Set 的 迭代 器 实现 类 ， 即 entrySet () .iterator() 的 返回 对 象 ， 必 须 实现 
迭代 器 的 remove 方 法 ， 这 是 因为 AbstractMap 的 remove 方 法 是 通过 
entrySet () .iterator () .remove 〈) 实现 的 。 


除了 提供 基础 方法 的 实现 ，AbstractMap 类 内 部 还 定义 了 两 个 公有 
的 静态 内 部 类 ， 表 示 键 值 对 : 








AbstractMap . SimpleEntry implements Entry<K, V> 
AbstractMap.SimpleImmutableEntry implements Entry<K,V> 





SimpleImmutableEntry 用 于 表示 只 读 的 键 值 对 ， 而 SimpleEntry 用 于 
表示 可 写 的 。 


Map 接 口 文档 建议 : 每 个 Map 接 口 的 实现 类 都 应 该 提供 至 少 两 个 标 
准 的 构造 方法 ， 一 个 是 默认 构造 方法 ， 男 一 个 接受 一 个 Map 类 型 的 参 


O 





具体 如 何 扩 展 AbstractMap 呢 ?我 们 定义 一 个 简单 的 Map 实 现 类 
MyMap， 内 部 还 是 用 DynamicArray， 如 代码 清单 12-7 所 示 。 


代码 清单 12-7 一 个 简单 的 Map 实 现 类 MyMap 





public class MyMap<K，V> extends AbstractMap<K, V> { 
private DynamicArray<Map.Entry<K, V>> darr; 
private Set<Map ,Entry<K，V>> entrySet = null; 
public MyMap() { 
darr = new DynamicArray<>(); 


} 

public MyMap(Map<? extends K, ? extends V> m) { 
this(); 
putAll(m); 


Q@override 
public Set<Entry<K，V>> entrySet() { 
Set<Map .Entry<K，V>> es = entrySet; 
return es != null ? es : (entrySet = new EntrySet()); 


Q@Override 


public V put(K key, V value) { 
for(int i = 0; i < darr.size(); i++) { 
Map ,Entry<K，V> entry = darr.get(i); 
if((key == null && entry.getkey() == null) 
|| (key != null && key.equals(entry.getkey()))) { 

V oldValue = entry.getValue(); 
entry.setValue(value); 
return oldValue; 


Map.Entry<K, V> newEntry = new AbstractMap.SimpleEntry<>(key, value); 
darr.add(newEntry); 
return null; 


class EntrySet extends AbstractSet<Map.Entry<K, V>> { 
public Iterator<Map.Entry<K, V>> iterator() { 
return new DynamicArrayIterator<Map.Entry<K, V>>(darr); 


public int size() { 
return darr.size(); 





我 们 定义 了 两 个 构造 方法 ， 实 现 了 put 和 entrySet 方 法 。put 方 法 先 通 
过 循环 查找 是 否 已 存在 对 应 的 键 ， 如 果 存 在 则 修改 值 ， 否 则 新 建 一 个 键 
值 对 (类 类 型 为 AbstractMap.Simple_Entry) 并 添加 。entrySet 返 回 的 类 型 是 
一 个 内 部 类 EntrySet， 它 继承 自 AbstractSet， 重 写 了 size 和 iterator 方 法 ， 
iterator 方 法 中 ， 返 回 的 是 迭代 器 类 型 是 DynamicArraylterator， 它 文 持 
remove 方 法 。 





12.1.5 AbstractSet 





AbstractSet 提 供 了 Set 接 口 的 基础 实现 ， 它 继承 自 
AbstractCollection， 增 加 了 equals 和 hashCode 方 法 的 默认 实现 。Set 接 口 
萎 求 容器 门 个 能 包 售 旦 复元 系 ， AbstractSet 并 没有 实现 该 约束 ， 子 类 需 
要 目 己 实现 。 








扩展 AbstractSet 与 AbstractCollection 是 类 似 的 ， 
复元 素 的 约束 ， 比 如 ，add 方 法 内 需要 检查 元 素 是 否 已 经 添加 过 了 。 有 具 
体 实 现 比 较 简 单 ， 我 们 束 不 歼 述 了 。 











12.1.6 AbstractQueue 





AbstractQueue 提 供 了 Queue 接 口 的 基础 实现 ， 它 继承 自 
AbstractCollection， 实 现 了 如 下 方法 : 





public boolean add(E e) 

public boolean addAll(Collection<? extends E> c) 
public void clear() 

public E element() 

public E remove() 








这 些 方法 是 基于 Queue 接 口 的 其 他 方法 实现 的 ， 包 括 : 





E peek(); 
E poll(); 
boolean offer(E e); 








扩展 AbstractQueue 需 要 实现 这 些 方法 ， 具 体 逻 辑 也 比较 简单 ， 我 们 
就 不 袭 述 了 。 


A Rr 


本 小 节 介 绍 了 Java 容 器 类 中 的 抽象 类 AbstractCollection、 
AbstractList、AbstractSequen-tialList、AbstractSet、AbstractQueue 以 及 
AbstractMap， 介 绍 了 它们 与 容器 接口 和 具体 类 的 关系 ， 对 每 个 抽象 
类 ， 介 绍 了 它 提供 的 基础 功能 ， 如 何 实现 ， 并 举例 说 明了 如 何 进 行 扩 
展 ， 完 整 的 代码 在 github 上 ， 地 址 为 https://github.com/swiftma/program- 
logic ， 位 于 包 shuo.lao-ma.collection.c52 下 。 


前 面 我 们 提 到 ， 实 现 了 容器 接口 ， 就 可 以 方便 地 参与 到 容器 类 这 个 
大 家 庭 中 进行 相互 协作 ， 也 可 以 方便 地 利用 Collections 这 个 类 实现 的 通 
用 算法 和 功能 。 


但 Collections 都 实现 了 哪些 算法 和 功能 ? 都 有 什么 用 途 ? 如何 使 
用 ? 内 部 又 是 如 何 实现 的 ? 有 何 参考 价值 ? 让 我 们 下 一 小 节 来 探讨 。 








12.2 Collections 





类 Collections 以 静态 方法 的 方式 提供 了 很 多 通用 算法 和 功能 ， 这 些 
功能 大 概 可 以 分 为 两 类 。 


1) 对 容器 接口 对 象 进行 操作 。 

2) 返回 一 个 容器 接口 对 象 。 

对 于 第 1 类 ， 操 作 大 概 可 以 分 为 三 组 。 

查找 和 替换 。 

.排序 和 调整 顺序 。 

添加 和 修改 。 

对 于 第 2 类 ， 大 概 可 以 分 为 两 组 。 

适配器: 将 其 他 类 型 的 数据 转换 为 容器 接口 对 象 。 

.装饰 器 : 修饰 一 个 给 定 容 器 接口 对 象 ， 增 加 某 种 性 质 。 

它们 都 是 围绕 容器 接口 对 象 的 ， 第 1 类 是 针对 容器 接口 的 通用 操 
作 ， 这 是 面向 接口 编程 的 一 种 体现 ， 是 接口 的 典型 用 法 ; 第 2 类 是 为 了 


使 更 多 类 型 的 数据 更 为 方便 和 安全 地 参与 到 容器 类 协作 体系 中 。 下 面 我 
们 分 别 介绍 这 两 类 操作 及 其 实现 原理 ， 代 码 分 析 基 于 Java 7。 














12.2.1 ”查找 和 替换 





查找 和 蔡 换 包含 多 组 方法 。 碍 找 包 括 二 分 查找 、 碍 找 最 大 值 /最 小 
值 、 查 找 元 素 出 现 次 数 、 查 找 子 List、 查 看 两 个 集合 是 否 有 交集 等 ， 下 
面具 体 介 绍 。 


1 = 





我 们 在 介绍 Arrays 类 的 时 候 介绍 过 二 分 查找 ，Arrays 类 有 针对 数组 
对 象 的 二 分 查找 方法 ，Collections 提 供 了 人 针对 List 接 口 的 二 分 查找 ， 如 下 
所 示 : 





public static <T> int binarySearch( 
List<? extends Comparable<? super T>> list, T key) 
public static <T> int binarySearch(List<? extends T> list, 
T key, Comparator<? super T> c) 








从 方法 参数 角度 而 言 ， 一 个 要 求 List 的 每 个 元 素 实 现 Comparable 接 
口 ， 另 一 个 不 需要 ， 但 要 求 提 供 Comparator。 二 分 查找 假定 List 中 的 元 
素 是 从 小 到 大 排序 的 。 如 果 是 从 大 到 小 排序 的 ， 需 要 传递 一 个 逆序 
Comparator 对 象 ，Collections 提 供 了 返回 逆序 Comparator 的 方法 ， 之 前 我 
们 也 用 过 : 








public static <T> Comparator<T> reverseorder() 
public static <T> Comparator<T> reverseOrder(Comparator<T> cmp) 





比如 ， 可 以 这 么 用 : 





List<Integer> list = new ArrayList<>(Arrays.asList(new Integer[]{ 
35, 24, 13, 12, 8, 7, 1 
})); 


System,.out.println(Collections.binarySearch(list, 7, 
Collections.reverseOrder())); 





输出 为 5。List 的 二 分 查找 的 基本 思路 与 Arrays 中 的 是 一 样 的 ， 数 
组 可 以 根据 索引 直接 定位 任意 元 素 ， 实 现 效率 很 高 ， 但 List 就 不 一 定 
了 ， 具 体 分 为 两 种 情况 ， 如 果 List 可 以 随机 访问 (如 数组 ) ， 即 实现 了 
RandomAccess 接 口 ， 或 者 元 素 个 数 比较 少 ， 则 实现 思路 与 Arrays 一 样 ， 
根据 索引 直接 访问 中 间 元 素 进行 比较 ， 和 否则 使 用 迭代 器 的 方式 移动 到 中 
间 元 素 进 行 比 较 。 从 效率 角度 ， 如 果 List 文 持 随 机 访问 ， 效 率 为 O (log> 
CN) ) ， 如 果 通 过 迭代 器 ， 那 么 比较 的 次 数 为 0 (log (CN) )， 但 遍 
历 移动 的 次 数 为 O(N) ，N 为 列表 长 度 。 


2. 查 找 最 大 值 /最 小 值 
Collections 提 供 了 如 下 查找 最 大 值 /最 小 值 的 方法 (省 略 了 修饰 符 



































public static) : 





<T extends Object & Comparable<? super T>> T max(Collection<? extends T> coll) 
<T> T max(Collection<? extends T> coll, Comparator<? Super T> comp) 
<T extends Object & Comparable<? super T>> T min(Collection<? extends T> coll) 
<T> T min(Collection<? extends T> coll, Comparator<? super T> comp) 





含义 和 用 法 部 很 直接 ， 实 现 思路 也 很 简单 ， 就 是 通过 碗 代 絮 进行 比 
2 比如 : 





public static <T extends Object & Comparable<? super T>> T max( 
Collection<? extends T> coll) { 
Iterator<? extends T> i = coll.iterator(); 
T candidate = i.next(); 
while(i.hasNext()) { 
T next = i.next(); 
if(next.compareTo(candidate) > 0) 
candidate = next; 


return candidate; 





3. 其 他 方法 
查找 元 素 出 现 次 数 ， 方 法 为 : 








public static int frequency(Collection<?> c, Object 0o) 





返回 元 素 o 在 容器 c 中 出 现 的 次 数 ，o 可 以 为 null。 含 义 很 简单 ， 实 现 
思路 也 很 简单 ， 就 是 通过 友 代 需 进 行 比较 计数 。 


Collections 提 供 了 如 下 方法 ， 在 source List 中 查找 target List 的 位 置 : 





public static int indexofSubList(List<?> source, List<?> target) 
public static int lastIindexOfSubList(List<?> source, List<?> target) 





indexOfSubList 从 开头 找 ，lastIndexOfSubList 从 结尾 找 ， 没 找到 返 
回 -1， 找 到 返回 第 一 个 匹配 元 素 的 索引 位 置 。 这 两 个 方法 的 实现 都 是 属 
于 “暴力 破解 "型 鸭 ， 将 target 列 表 与 Source 从 第 一 个 元 素 开 始 的 列表 逐个 
元 素 进行 比较 ， 如 果 不 匹 配 ， 则 与 source 从 第 二 个 元 素 开 始 的 列表 比 





较 ， 再 不 匹配 ， 与 Source 从 第 三 个 元 素 开 始 的 列表 比较 ， 以 此 类 推 。 
查看 两 个 集合 是 否 有 交集 ， 方 法 为 : 





public static boolean disjoint(Collection<?> ci1, Collection<?> c2) 





如 果 c1 和 c2 有 交集 ， 返 回 值 为 false; 没有 交集 ， 返 回 值 为 tue。 实 
现 原理 也 很 简单 ， 避 历 其 中 一 站 容 冲 ;于 每 个 元 束 ， 在 六 一 个 容 介 里 通 
过 contains 方 法 检查 是 否 包 含 该 元 素 ， 如 果 包 含 ， 返 回 false， 如 果 最 后 
个 包含 任何 元 素 返 回 true。 这 个 方法 的 代码 会 根据 容器 是 否 为 Set 以 及 集 
合 大 小 进行 性 能 优化 ， 即 选择 哪个 容器 进行 表 历 ， 哪 个 容器 进行 检查 ， 
以 减少 总 的 比较 次 数 | 具体 我 们 就 不 介绍 了 。 


玲 换 方法 为 : 








public static <T> boolean replaceAll(List<T> list, T oldVal, T newVal) 





将 List 中 的 所 有 oldVal 蔡 换 为 newVal， 如 果 发 生 了 替换 ， 返 回 值 为 
true， 奋 则 为 false。 用 法 和 实现 都 比较 简单 ， 就 不 歼 述 了 。 


12.2.2 ”排序 和 调整 顺序 


针对 List 接 口 对 象 ，Collections 除 了 提供 基础 的 排序 ， 还 提供 了 若干 
调整 顺序 的 方法 ， 包 括 交 换 元 素 位 置 、 翻 转 列表 顺序 、 随 机 化 重 排 、 循 
环 移 位 等 ， 下 面具 体 介 绍 


1. 排 序 、 交 换 位 置 与 翻转 


Arrays 类 有 针对 数组 对 象 的 排序 方法 ，Collections 提 供 了 针对 List 接 
口 的 排序 方法 ， 如 下 所 示 : 





public static <T extends Comparable<? super T>> void sort(List<T> list) 
public static <T> void sort(List<T> list, Comparator<? super T> c) 





使 用 很 简单 ， 束 不 举例 了 ， 内 部 它 是 通过 Arrays.sort 实 现 的 ， 先 将 


List 元 素 复制 到 一 个 数组 中 ， 然 后 使 用 Arrays.sort， 排 序 后 ， 再 复制 回 
List。 代 码 如 下 所 示 : 





public static <T extends Comparable<? super T>> void sort(List<T> list) { 
Object[] a = list.toArray(); 
Arrays.sort(a); 
ListIterator<T> i = list.]listIiterator(); 
for(int j=0; j<a.length; j++) { 
i.next(); 
i.set((T)a[j]); 





交换 元 系 位 置 的 方法 为 : 





public static void swap(List<?> list, int i, int j) 





交换 list 中 第 i 个 和 第 j 个 元 素 的 内 容 。 实 现代 码 为 : 





public static void swap(List<?> list, int i, int j) { 
final List 1 = list,; 
1.set(i, 1.set(j, 1.get(i))); 





翻转 列表 顺序 的 方法 为 : 





public static void reverse(List<?> list) 





将 list 中 的 元 素 顺序 翻转 过 来 。 实 现 思路 就 是 将 第 一 个 和 最 后 一 个 
交换 ， 第 二 个 和 倒数 第 二 个 交换 ， 以 此 类 推 ， 直 到 中 间 两 个 元 素 交 换 完 
毕 。 如 果 1list 实 现 了 RandomAccess 接 口 或 列表 比较 小 ， 根 据 索引 位 置 ， 
使 用 上 面 的 swap 方法 进行 交换 ， 人 否则 ， 由 于 直接 根据 索引 位 置 定位 元 际 
比较 低 ， 使 用 一 前 一 后 两 个 listIterator 定 位 待 交 换 的 元 素 ， 具 体 代 码 








public static void reverse(List<?> list) { 
int size = list.size(); 
if(size < REVERSE THRESHOLD || list instanceof RandomAccess) { 
for(int i=0, mid=size>>1, j=size-1; i<mid; i++, j--) 
swap(list, i, j); 


} else { 
ListIterator fwd = list.listIterator(); 
ListIterator rev = list.1listIiterator(size),; 
for(int i=0, mid=list.size()>>1; i<mid; i++) { 
Object tmp = fwd.next(); 
fwd,.set(rev.previous()); 
rev.set(tmp); 





2. 随 机 化 重 排 


我 们 在 随机 一 节 介 绍 过 洗 牌 算法 ，Collections 直 接 提 供 了 对 List 元 素 
洗 牌 的 方法 : 





public static void shuffle(List<?> list) 
public static void shuffle(List<?> list, Random rnd) 





实现 思路 与 随机 一 节 介 绍 的 是 一 样 的 ， 从 后 往 前 遍历 列表 ， 逐 个 给 
每 个 位 置 重新 赋值 ， 值 从 前 面 的 未 重新 赋值 的 元 素 中 随机 挑选 。 如 果 列 
表 实 现 了 RandomAccess 接 口 ， 或 者 列表 比较 小 ， 直 接 使 用 前 面 swap 方 
和 先 将 列表 内 容 复制 到 一 个 数组 中 ， 洗 牌 ， 再 复制 回 
列表 。 代 位 为 : 





public static void shuffle(List<?> list, Random rnd) { 
int size = list.sizel(); 
if(size < SHUFFLE THRESHOLD || list instanceof RandomAccess) { 
for(int i=size; i>1; i--) 
swap(list, i-1, rnd.nextInt(i)); 
} else { 
Object arr[] = = list.toArray(); 
// 对 数组 进行 洗 牌 
for(int i=size; i>1; i--) 
swap(arr, i-1, rnd.nextInt(i)); 
// 将 数组 中 洗 牌 后 的 结果 保存 回 list 
ListIterator it = list.listIterator(); 
for(int i=0; i<arr.length; i++) { 
it.next(); 
it.set(arr[i]); 















































} 
} 





3. 循 环 移 位 


我 们 解释 下 循环 移 位 的 概念 ， 比 如 列表 为 : 





[8, 5, 3, 6, 2] 





循环 右 移 2 位 ， 会 变 为 : 





[6, 2, 8, 5, 3] 





如 琳 是 循环 左 移 2 位 ， 会 变 为 : 





[3, 6, 2, 8, 5] 





因为 列表 长 度 为 5， 循 环 左 移 3 位 和 循环 右 移 2 位 的 效果 是 一 样 的 。 
循环 移 位 的 方法 是 : 





public static void rotate(List<?> list, int distance 








distance 表 示 循 环 移 位 个 数 ， 一 般 正 数 表 示 向 右 移 ， 负 数 表 示 向 左 
移 ， 比 如 : 





List<Integer> list1 = Arrays.asList(new Integer[]{ 
8, 5, 3, 6, 2 

}); 

Collections.rotate(1list1, 2); 

System.out.println(1ist1); 

List<Integer> list2 = Arrays.asList(new Integer[]{ 
8, 5, 3, 6, 2 

); 
Collections.rotate(list2, -2); 
System,.out.println(1ist2); 





输出 为 : 





[6, 2, 8, 5, 3] 
[3, 6, 2, 8, 5] 





这 个 方法 很 有 用 的 一 点 是 : 它 也 可 以 用 于 子 列表 ， 可 以 调整 子 列表 
内 的 顺序 而 不 改变 其 他 元 素 的 位 置 。 比 如 ， 将 第 j 个 元 素 向 前 移动 到 
k (k3j) 5 可 以 这 么 写 : 





Collections.rotate(list.subList(j, k+1), -1); 





再 举 个 例子 : 





List<Integer> list = Arrays.asList(new Integer[]{ 
8, 5, 3, 6, 2, 19, 21 

}); 

Collections.rotate(list.subList(1, 5), 2); 

System.out.println(1ist); 





输出 为 : 





[8, 6, 2, 5, 3, 19, 21] 





这 个 类 似 于 列表 内 的 * 剪 切 ” 和 “粘贴 >， 将 子 列表 [5，3]* 剪 切 ”，“ 粘 
贴 ? 到 2 后 面 。 如 果 需 要 实现 类 似 “* 剪 切 ” 和 “粘贴 ”的 功能 ， 可 以 使 用 
rotate () 方法 。 


循环 移 位 的 内 部 实现 比较 巧妙 ， 根 据 列 表 大 小 和 是 否 实现 了 
RandomAccess 接 口 ， 有 两 个 算法 ， 都 比较 巧妙 ， 两 个 算法 在 《编程 珠 
现 》 这 本 书 的 2.3 节 有 描述 。 


限于 篇 幅 ， 我 们 只 解释 下 其 中 的 第 二 个 算法 ， 它 将 循环 移 位 看 作 列 
表 的 两 个 子 列表 进行 顺序 交换 。 再 来 看 上 面 的 例子 ， 循 环 左 移 2 位 : 














[8, 5) 3， 6, 2] -> [3， 6, 2, 8, 5] 





就 是 将 [8，5] 和 [3，6，2] 两 个 子 列表 的 顺序 进行 交换 。 循 环 右 移 两 


位 : 





[8， 5, 3, 6, 2] = [6, 2, 8, 5, 3] 





就 是 将 [8，5，3] 和 [6，2] 两 个 子 列表 的 顺序 进行 交换 。 
根据 列表 长 度 size 和 移 位 个 数 distance， 可 以 计算 出 两 个 子 列表 的 分 
隅 点 ， 有 了 两 个 子 列表 后 ， 两 个 子 列 表 的 顺序 交换 可 以 通过 三 次 翻转 实 
现 。 比 如 ， 有 A 和 B 两 个 子 列 表 ，A 有 m 个 元 素 ，B 有 n 个 元 素 : al ay .… 
dm bi b>» De 》 要 变 为 b; b， wD dl d» .dm 9 可 经 过 三 次 翻转 实现 : 
(1) 翻转 子 列表 A 
al d2 ...am bi b, ...b， 一 am .….q2z dl bj b>» ...b， 
(2) 翻转 子 列表 B 
dm .….q2 dl bj b, ...b， 一 am .….q2 dl b， ...b> bj 
(3) 翻转 整个 列表 
am ...ao al by ...b, bi 一 bi b; ...b, al ao ...am 


这 个 算法 的 整体 实现 代码 为 : 





private static void rotate2(List<?> list, int distance) { 

int size = list.sizel(); 
if(size == 0) 

return; 
int mid = -distance % size; 
if(mid < 0) 

mid += size; 
if(mid == 0) 

return; 
reverse(list.subList(0, mid)); 
reverse(list.subList(mid, size)); 
reverse(list); 





mid 为 两 个 子 列表 的 分 割 点， 调用 了 三 次 reverse 方 法 以 实现 子 列表 
顺序 交换 。 


12.2.3 ”添加 和 修改 


Collections 也 提供 了 几 个 批量 添加 和 修改 的 方法 ， 逻 辑 都 比较 简 
单 ， 我 们 看 下 。 


批量 添加 ， 方 法 为 : 





public static <T> boolean addAll(Collection<? super T> c, T... elements) 








A 
便 ， 比 如 : 





List<String> list = new ArrayList<String>(); 

String[] arr = new String[]{" 深 入 "," 浅 出 "}，; 
Collections.addAll(list,，"hello"，"world"，,，" 老 马 ",， "编程 " )，; 
Collections.addAll(list, arr); 

System.out.println(1ist); 








输出 为 : 








[hello，world， 老 马 ， 编 程 ， 深 入 ， 浅 出 ] 





批量 填充 固定 值 ， 方 法 为 : 





public static <T> void fill(List<? super T> list, T obj) 





这 个 方法 与 Arrays 类 中 的 名 方法 是 类 似 的 ， 给 每 个 元 系 设 置 相同 的 
值 。 


批量 复制 ， 方 法 为 : 





public static <T> void copy(List<? super T> dest, List<? extends T> src) 





将 列表 src 中 的 每 个 元 素 复 制 到 列表 dest 的 对 应 位 置 处 ， 禾 新 dest 中 
原来 的 值 ，dest 的 列表 长 度 不 能 小 于 src，dest 中 超过 src 长 度 部 分 的 元 素 


不 受 影响 。 


12.24 适配器 


所 谓 适 配器 ， 就 是 将 一 种 类 型 的 接口 转换 成 另 一 种 接口 ， 类 似 于 电 
子 设 备 中 的 各 种 USB 转 接头 ， 一 端 连接 茶 种 特殊 类 型 的 接口 ， 一 段 连接 
标准 的 USB 接 口 。Collections 类 提供 了 几 组 类 似 于 适 配 需 的 方法 : 


. 室 容 器 方法 ; 类似 于 将 null 或 "空转 换 为 一 个 标准 的 容器 接口 对 
象 


人 


:其 他 适 配 方法 : 将 Map 转 换 为 Set 等 。 

它们 接受 其 他 类 型 的 数据 ， 转 换 为 一 个 容器 接口 ， 目 的 是 使 其 他 类 
型 的 数据 更 为 方便 地 参与 到 容器 类 协作 体系 中 ， 下 面 ， 我 们 分 别 来 看 
下 
1. 空 容器 方法 


Collections 中 有 一 组 方法 ， 返 回 一 个 不 包含 任何 元 素 的 容器 接口 对 
象 ， 如 下 所 示 : 











public static final <T> List<T> emptyList() 
public static final <T> Set<T> emptySet() 
public static final <K,V> Map<K,V> emptyMap() 
public static <T> Iterator<T> emptyIterator() 





分 别 返 回 一 个 空 的 List、Set、Map 和 Iterator 对 象 。 比 如 ， 可 以 这 么 
用 : 





List<String> list = Collections.emptyList(); 
Map<String, Integer> map = Collections.emptyMap(); 
Set<Integer> Set = Collections.emptySet(); 








一 个 空 容 右 对 象 有 什么 用 呢 ? 空 容器 对 象 经 常用 作 方 法 返回 值 。 比 
2 








public static List<Integer> asList(int... elements) 








在 参数 为 空 时 ， 这 个 方法 应 该 返回 null 还 是 一 个 空 的 List 呢 ? 如 果 返 
回 null， 方 法 调用 者 必须 进行 检查 ， 然 后 分 别处 理 ， 代 人 码 结构 大 概 如 下 
所 示 : 





int[] arr = ..; // 从 别 的 地 方 获 取 到 的 arr 
List<Integer> list = asList(arr); 
if(list==null){ 

Li 
}elsef{ 

LLs: 
} 





这 段 代 码 比 较 烦 玉 ， 而 且 如 果 不 小 心 筷 记 检 查 ， 则 有 可 能 会 抛 出 空 
站 针 异 常 ， 所 以 推荐 做 法 是 返回 一 个 空 的 List， 以 便 调用 者 安全 地 进行 
统一 人 处理， 比如 ，asList 可 以 这 样 实现 : 





public static List<Integer> asList(int... elements){ 
if(elements.1length==0){ 
return Collections.emptyList(); 


List<Integer> list = new ArrayList<>(elements, Jength ) ; 
for(int e : elements){ 
list.add(e); 


return list,; 





返回 一 个 室 的 List。 也 可 以 这 样 实现 : 





return new ArrayList<Integer>(); 





这 与 emptyList 方 法 有 什么 区 别 呢 ?emptyList 方 法 返回 的 是 一 个 静态 
不 可 变 对 象 ， 它 可 以 节省 创建 新 对 象 的 内 存 和 时 间 开 销 。 我 们 来 看 下 
emptyList 方 法 的 具体 定义 : 





public static final <T> List<T> emptyList() { 
return (List<T>) EMPTY_LIST， 





EMPTY _ LIST 的 定义 为 : 





public static final List EMPTY_LIST = new EmptyList<>(); 





是 一 个 静态 不 可 变 对 象 ， 类 型 为 EmptyList， 它 是 一 个 私有 基态 内 
部 类 ， 继 承 自 Abstract-List， 主 要 代码 为 : 





private static class EmptyList<E> 
extends AbstractList<E> 
implements RandomAccess { 
public Iterator<E> iterator() { 
return emptyIterator(); 


public ListIterator<E> listIiterator() { 
return emptyListIterator(); 


public int size() {return 0;} 
public boolean isEmpty() {return true;} 
public boolean contains(Object obj) {return false;} 
public boolean containsAll(Collection<?> c) { return c.isEmpty(); } 
public Object[] toArray() { return new Object[0]; } 
public <T> T[] toArray(T[] a) { 

if(a.length > 0) 

a[0] = null; 

return a; 
} 
public E get(int index) { 

throw new IndexOutOofBoundsException("Index: "+index); 


} 
public boolean equals(Object o) { 
return (0 instanceof List) && ((List<?>)0).isEmpty(); 


public int hashCode() { return 1; } 





emptyIterator 和 emptyListIterator 返 回 空 的 迭代 器 。emptylterator 的 代 
码 为 : 





public static <T> Iterator<T> emptyIterator() { 
return (Iterator<T>) EmptyIterator .EMPTY_ITERATOR， 
} 





EmptyIterator 是 一 个 静态 内 部 类 ， 代 码 为 : 





private static class EmptyIterator<E> implements Iterator<E> { 
static final EmptyIterator<Object> EMPTY_ITERATOR 


= new EmptyIterator<>() ; 
public boolean hasNext() { return false; } 
public E next() { throw new NoSuchElementException(); } 
public void remove() { throw new IllegalStateException(); } 








以 上 这 些 代 码 都 比较 简单 ， 吏 不 欧 述 了 上。 需要 注意 的 是 ， 
EmptyList 个 支持 修改 操作 ， 比 如 : 





Collections.emptyList().add("hello"); 





会 抛 出 异常 UnsupportedOperationException 。 


如 果 返 回 值 只 是 用 于 读 取 ， 可 以 使 用 emptyList 方 法 ， 但 如 果 返 回 值 
还 用 于 写 入 ， 则 需要 新 建 一 个 对 象 。 其 他 空 容器 方法 与 emptyList 方 法 类 
似 ， 我 们 就 不 六 述 了 。 它 们 都 可 以 被 用 于 方法 返回 值 ， 以 便 调用 者 统一 
进行 处 理 ， 同 时 节省 时 间 和 内 存 开销 ， 它 们 的 共同 限制 是 返回 值 不 能 
于 写 入 。 我 们 将 空 容 需 方法 看 作 适 配器 ， 是 因为 它 将 null 或 * 空 ?转换 为 
了 夫人 古 对 过， 

需要 说 明 的 是 ， 在 Java 9 中 ， 可 以 使 用 List、Map 和 Set 不 带 参数 的 of 














1. List list = Collections.emptyList(); 
2. List list = List.of(); 





2. 单 一 对 象 方法 


Collections 中 还 有 一 组 方法 ， 可 以 将 一 个 单独 的 对 象 转换 为 一 个 标 
准 的 容器 接口 对 象 ， 比 如 ; 





public static <T> Set<T> singleton(T 0) 
public static <T> List<T> singletonList(T 0o) 
public static <K,V> Map<K,V> singletonMap(K key, V value) 





比如 ， 可 以 这 么 用 : 





Collection<String> coll = Collections.singleton( "编程 ")，; 
Set<String> set = Collections. singleton( "编程" )，; 

List<String> list = Collections. singletonList(" 老 马 "); 

Map<String, String> map = Collections.singletonMap(" 老 马 ",， "编程 "); 





这 些 方法 也 经 常用 于 构建 方法 返回 值 ， 相 比 新 建 容器 对 象 并 添加 元 
素 ， 这 些 方法 更 为 简洁 方便 ， 此 外 ， 它 们 的 实现 更 为 高 效 ， 它 们 的 实现 
类 都 针对 单一 对 象 进行 了 优化 。 比 如 ，singleton 方 法 的 代码 : 





public static <T> Set<T> singleton(T o) { 
return new SingletonSet<>(0); 
} 





新 建 了 一 个 SingletonSet 对 象 ，SingletonSet 是 一 个 静态 内 部 类 ， 主 
要 代码 为 : 





private static class SingletonSet<E> 
extends AbstractSet<E> { 
private final E element; 
SingletonSet(E e) {element = e;} 
public Iterator<E> iterator() { 
return singletonIterator(element); 
} 


public int size() {return 1;} 
public boolean contains(Object o) {return eq(o, element);} 





singletonIterator 是 一 个 内 部 方法 ， 将 单一 对 象 转换 为 了 一 个 从 代 器 
接口 对 象 ， 代 码 为 : 





static <E> Iterator<E> SingletonIterator(final E e) { 
return new Iterator<E>() { 
private boolean hasNext = true; 
public boolean hasNext() { 
return hasNext ， 
} 


public E next() { 

if(hasNext) { 
hasNext = false; 

return e; 


} 


throw new NoSuchElementException(); 


public void remove() { 
throw new UnsupportedOoperationException(); 
} 


}; 








ed 方法 束 是 比较 两 个 对 象 是 否 相 同 ， 考 夸 了 nul 的 情况 ， 代 码 为 : 





static boolean eq(Object 01，0Object 02) { 
return o1==null ? 02==nul1 : o1.equals(o2); 
} 





需要 注意 的 是 ，singleton 方 法 返回 的 也 是 不 可 变 对 象 ， 只 能 用 于 读 
取 ， 写 入 会 抛 出 UnsupportedOperationException 异 常 。 其 他 singletonXXX 
方法 的 实现 思路 是 类 似 的 ， 返 回 值 也 都 只 能 用 于 读 取 ， 不 能 写 入 ， 我 们 
就 不 闹 述 了 。 


除了 用 于 构建 返回 值 ， 这 些 方法 还 可 用 于 构建 方法 参数 。 比 如 ， 从 
容器 中 删除 对 象 ，Collection 有 如 下 方法 : 





boolean remove(Object 0); 
boolean removeAll(Collection<?> c); 








remove 方 法 只 会 删除 第 一 条 匹配 的 记录 ，removeAll 方 法 可 以 删除 
所 有 匹配 的 记录 ， 但 需要 一 个 容器 接口 对 象 ， 如 果 需 要 从 一 个 List 中 删 
除 所 有 匹配 的 某 一 对 象 呢 ? 这 时 ， 就 可 以 使 用 Collections.singleton 封 装 
这 个 要 删除 的 对 象 。 比 如 ， 从 list 中 删除 所 有 的 "b"， 代 码 如 下 所 示 : 











List<String> list = new ArrayList<>(); 

Collections. addAl1(1ist, way MD Mom. Md by 
Jist.removeAll(Collections.singleton("b")); 
System,.out.println(1ist); 





需要 说 明 的 是 ， 在 Java 9 中 ， 可 以 使 用 List、Map 和 Set 的 of 方法 达到 
singleton 同 样 的 功能 ， 也 束 是 说 ， 如 下 两 行 代码 的 效果 是 相同 的 : 





1. Set<String> b = Collections.singleton("b"); 
2. Set<String> b = Set.of("b"); 





除了 以 上 两 组 方法 ，Collections 中 还 有 如 下 适配器 方法 ， 用 的 相对 
较 少 ， 我 们 就 不 详细 介绍 了 。 








// 将 Map 接 口 转换 为 Set 接 
public static <E> Set<E> newSetFromMap(Map<E,Boolean> map) 
// 将 Deque 接 口 转换 为 后 进 先 出 的 队列 接 
public static <T> Queue<T> asLifoQueue(Deque<T> deque) 
// 返 回 包含 n 个 相同 对 象 o 的 List 接 


public static <T> List<T> nCopies(int n, T o) 
























































12.2.5 ”装饰 器 


装饰 器 接受 一 个 接口 对 象 ， 并 返回 一 个 同样 接口 的 对 象 ， 不 过 ， 新 
对 象 可 能 会 扩展 一 些 新 的 方法 或 属性 ， 扩 展 的 方法 或 属性 就 是 所 谓 
的 “装饰 ”， 也 可 能 会 对 原 有 的 接口 方法 做 一 些 修 改 ， 达 到 一 定 的 “ 装 
饰 ? 目 的 。Collections 有 三 组 装饰 器 方法 ， 它 们 的 返回 对 象 都 没有 新 的 方 
法 或 属性 ， 但 改变 了 原 有 接口 方法 的 性 质 ， 经 过 “装饰 ?5 后 ， 它 们 更 为 安 
全 了 ， 具体 分 别 是 写 安 全 、 类 型 安全 和 线程 安全 ， 我 们 分 别 来 看 下 。 


1 写 安 全 








写 安全 的 主要 方法 有 : 





public static <T> Collection<T> unmodifiableCollection( 
Collection<? extends T> c) 
public static <T> List<T> unmodifiableList(List<? extends T> list) 
public static <K,V> Map<K,V> unmodifiableMap(Map<? extends K, ? extends V> m) 
public static <T> Set<T> unmodifiableSet(Set<? extends T> s) 








顾名思义 ， 这 组 unmodifiableXXX 方 法 就 是 使 容器 对 象 变 为 只 读 
的 ， 常 。 为 什么 要 变 为 只 
读 的 呢 ?” 典 型 场景 是 : 需要 传递 一 个 容器 对 象 给 一 个 方法 ， 这 个 方法 可 
能 是 第 三 方 提供 kt 的， 为 避免 第 三 方 误 写 ， 所 以 在 传递 前 ， 变 为 只 读 的 ， 
中 不 : 








public static void thirdMethod(Collection<String> c){ 
c.add("bad"); 


public static void mainMethod( ) 
List<String> list = new ArrayList<>(Arrays.asList( 
new string[]{"a "bo. a "d"})); 
thirdMethod(Collections. unmodifiablecollection(1list)); 
} 


ee | 


这 样 ， 调 用 惑 会 触发 异 铅 ， 从 而 避免 了 将 错误 数据 插入 。 


这 些 方法 是 如 何 实现 的 呢 ? 每 个 方法 内 部 都 对 应 一 个 类 ， 这 个 类 实 
现 了 对 应 的 容 喜 接口 ， 它 内 部 是 符 装 饰 的 对 象 ， 只 读 方 法 传递 给 这 个 内 
部 对 象 ， 写 方法 抛 出 异常 。 比 如 ，unmodifiableCollection 方 法 的 代码 
为 : 

















public static <T> Collection<T> unmodifiableCollection( 
Collection<? extends T> c) { 
return new UnmodifiableCollection<>(c); 





UnmodifiableCollection 是 一 个 静态 内 部 类 ， 代 码 为 : 





static class UnmodifiableCollection<E> implements Collection<E>, 

Serializable { 
private static final long serialVersionUID = 1820017752578914078L; 
final Collection<? extends E> c; 
UnmodifiableCollection(Collection<? extends E> c) { 

if(c==null) 

throw new NullPpointerException(); 
this.c = c; 


} 

public int size() {return c.size();} 
public boolean isEmpty() {return c.isEmpty();} 
public boolean contains(Object 0o) {return c.contains(o);} 
public Object[] toArray() {return c.toArray();} 
public <T> T[] toArray(T[] a) {return c.toArray(a);} 
public String toString() {return c.toString();} 


public Iterator<E> iterator() { 

return new Iterator<E>() { 
private final Iterator<? extends E> i = c.iterator(); 
public boolean hasNext() {return i.hasNext();} 
public E next() {return i.next();} 
public void remove() { 

throw new UnsupportedoperationException( ) ; 

} 


}; 
} 


public boolean add(E e) { 
throw new UnsupportedoperationException( ) ; 


public boolean remove(Object o) { 
throw new UnsupportedOperationException(); 


public boolean containsAll(Collection<?> coll) { 
return c.containsAll(col1l1); 


} 
public boolean addAll(Collection<? extends E> coll) { 
throw new UnsupportedoperationException( ) ; 


public boolean removeAll(Collection<?> coll) { 


throw new UnsupportedoperationException( ) ; 


public boolean retainAll(Collection<?> coll) { 
throw new UnsupportedoperationException( ) ; 
} 


public void clear() { 
throw new UnsupportedOoperationException(); 
} 


} 





代码 比较 简单 ， 其 他 unmodifiableXXX 方 法 的 实现 也 都 类 似 ， 我 们 
束 不 袭 述 了 。 


2 站 型 过 全 


所 谓 类 型 安全 是 指 确保 容 需 中 不 会 保存 错误 类 型 的 对 象 。 容 髓 怎么 
会 允许 保存 错误 类 型 的 对 象 呢 ? 我 们 看 段 代码 : 





List list = new ArrayList<Integer>(); 
list.add("hello"); 
System,.out.println(1list); 





我 们 创建 了 一 个 Integer 类 型 的 List 对 象 ， 但 添加 了 字符 串 类 型 的 对 
象 "hello"， 编 译 没有 错误 ， 运 行 也 没有 异常 ， 程 序 输出 为 "[hello]"。 


之 所 以 会 出 现 这 种 情况 ， 是 因为 Java 是 通过 探 除 来 实现 泛 型 的 ， 而 
且 类 型 参数 是 可 选 的 。 正 常情 况 下 ， 我 们 会 加 上 类 型 参数 ， 让 泛 型 机 制 
来 保证 类 型 的 正确 性 。 但 是 ， 由 于 泛 型 是 Java 5 以 后 才 加 入 的 ， 之 前 的 
代码 可 能 没有 类 型 参数 ， 而 新 的 代码 可 能 需要 与 老 的 代码 互动 。 


为 了 避免 老 的 代码 用 错 类 型 ， 确 保 在 泛 型 机 制 失 灵 的 情况 下 类 型 的 
0 0 
L ”容器 六 : 








public static <E> List<E> checkedList(List<E> list, Class<E> type) 
public static <K，V> Map<K, V> checkedMap(Map<K, V> m, 

Class<K> keyType, Class<V> valueType) 
public static <E> Set<E> checkedSet(Set<E> s, Class<E> type) 





使 用 这 组 checkedXXX 方 法 ， 都 需要 传递 类 型 对 象 ， 这 些 方法 都 会 
使 容器 对 象 的 方法 在 运行 时 检查 类 型 的 正确 性 ， 如 果 不 匹 配 ， 会 抛 出 


ClassCastException 异 常 。 比 如 : 





List list = new ArrayList<Integer>(); 
list = Collections.checkedList(1list, Integer.class); 
list.add("hello"); 





这 次 ， 运 行 就 会 抛 出 异 营 ， 从 而 避免 错误 类 型 的 数据 插入 : 





java.lang.ClassCastException: Attempt to insert class java.lang.String element into 





这 些 checkedXXX 方 法 的 实现 机 制 是 类 似 的 ， 每 个 方法 内 部 都 对 应 
A 个 类 实现 了 对 应 的 容器 接口 ， 它 内 部 是 待 装饰 的 对 象 ， 大 部 
分 万) 去 ) 只 是 传递 给 这 个 内 部 对 象 ， 但 对 添加 和 修改 方法 ， 会 首先 进行 类 
型 检查 ， 类 型 不 匹配 会 抛 出 异常 ， 类 型 匹配 才 传 递 给 内 部 对 象 。 以 
checkedCollection 为 例 ， 我 们 来 看 下 代码 : 











public static <E> Collection<E> checkedCollection( 
Collection<E> c, Class<E> type) { 
return new CheckedCollection<>(c, type); 





CheckedCollection 是 一 个 静态 内 部 类 ， 主 要 代码 为 : 





static class CheckedCollection<E> implements Collection<E>, Serializable { 
private static final long serialVersionUID = 1578914078182001775L; 
final Collection<E> c; 
final Class<E> type; 
void typeCheck(Object o) { 
If(o != Null && !type.isInstance(o)) 
throw new ClassCastException(badElementMsg(o)); 


} 


private String badElementMsg(Object o) { 
return "Attempt to insert " + 0,getClass() + 
" element into collection with element type ”+ type; 


} 
CheckedCollection(Collection<E> c, Class<E> type) { 
if(c==null || type == null) 
throw new NullPpointerException(); 
this.c = c; 
this.type = type; 


} 
public int size() { return c.size(); } 
public boolean isEmpty() { return c.isEmpty(); } 


public boolean contains(Object o) { return c.contains(o); } 


public Object[] toArray() { return c.toArray(); } 
public <T> T[] toArray(T[] a) { return c.toArray(a); } 
public String toString() { return c.toSstring(); } 
public boolean remove(Object 0o) { return c.remove(o); } 
public void clear() { c.clear(); } 


public boolean containsAll(Collection<?> coll) { 
return c.containsAll(coll1); 


public boolean removeAll(Collection<?> coll) { 
return c.removeAll(col]l); 


public boolean retainAll(Collection<?> coll) { 
return c.retainAll(col]l); 


public Iterator<E> iterator() { 
final Iterator<E> it = c.iterator(); 
return new Iterator<E>() { 
public boolean hasNext() { return it.hasNext(); } 
public E next() { return it.next(); } 
public void remove() { it.remove(); }}; 


} 

public boolean add(E e) { 
typeCheck(e); 
return c.add(e); 





代码 比较 简单 ，add 方 法 中 ， 会 先 调用 typeCheck 进 行 类 型 检查 。 其 
他 checkedXXX 方 法 的 实现 也 都 类 似 ， 我 们 束 不 次 述 了 。 


3 线程 安全 


关于 线程 ， 我 们 后 续 章 节 会 详细 介绍 ， 这 里 简要 说 明 下 。 之 前 我 们 
介绍 的 各 种 容器 类 基本 都 不 是 线程 安全 的 ， 也 就 是 说 ， 如 果 多 个 线程 同 
时 读 写 同一 个 容器 对 象 ， 是 不 安全 的 。Collections 提 供 了 一 组 方法 ， 可 
以 将 一 个 容器 对 象 变 为 线程 安全 的 ， 比 如 : 





public static <T> Collection<T> synchronizedCollection(Collection<T> c) 
public static <T> List<T> synchronizedList(List<T> list) 

public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) 

public static <T> Set<T> SynchronizedSet(Set<T> s) 





需要 说 明 的 是 ， 这 些 方法 都 是 通过 给 所 有 容器 方法 加 锁 来 实现 的 ， 
这 种 实现 并 不 是 最 优 的 。Java 提 供 了 很 多 专门 针对 并 发 访问 的 容器 类 ， 
我 们 在 第 17 章 介绍 。 





> 让 全 


本 节 介 绍 了 类 Collections 中 的 两 类 操作 。 第 一 类 操作 是 一 些 通 用 算 
法 ， 包 括 查 找 、 蔡 换 、 排 序 、 调 整 顺序 、 添 加 、 修 改 和 等， 这些 算法 操作 
的 都 是 容器 接口 对 象 ， 这 是 面向 接口 编程 的 一 种 体现 ， 只 要 对 象 实现 了 
这 些 接口 ， 就 可 以 使 用 这 些 算法 。 第 二 类 操作 都 返回 一 个 容器 接口 对 
象 ， 这 些 方法 代表 两 种 设计 模式 ， 一 种 是 适配器 ， 男 一 种 是 装饰 器 ， 我 
We 以 及 这 些 方 法 的 用 法 、 适 用 场合 和 实现 机 
制 |。 








12.3 ”容器 类 总 结 


前 面 章 节 中 ， 我 们 介绍 了 多 种 容 右 类 ， 本 方 进 行 简要 总 结 ， 我 们 主 
要 从 三 个 角度 进行 总 结 : 


:用 法 和 特点 ; 
“数据 结构 和 算法 ; 


:设计 思维 和 模式 。 
12.3.1 用 法 和 特点 


图 12-1 包 含 了 容器 类 主要 的 接口 和 类 ， 我 们 还 是 用 该 图 进行 总 结 。 
容器 类 有 两 个 根 接口 ， 分 别 是 Collection 和 Map，Collection 表 示 单 个 元 素 
的 集合 ，Map 表 示 键 值 对 的 集合 。 


Collection 表 示 的 数据 集合 有 基本 的 增 、 删 、 查 、 遍 历 等 方法 ， 但 没 
有 定义 元 际 间 的 顺序 或 位 置 ， 也 没有 规定 是 否 有 重复 元 素 。 


List 是 Collection 的 子 接口 ， 表 示 有 顺序 或 位 置 的 数据 集合 ， 增 加 了 
根据 索引 位 置 进行 操作 的 方法 。 它 有 两 个 主要 的 实现 类 : ArrayList 和 
LinkedList。ArrayList 基 于 数组 实现 ，LinkedList 基 于 链表 实现 ; 
ArrayList 的 随机 访问 效率 很 高 ， 但 从 中 间 插 入 和 删除 元 素 需 要 移动 元 
素 ， 效 率 比 较 低 ，LinkedList 则 正好 相反 ， 随 机 访问 效率 比较 低 ， 但 增 
删 元 素 只 需要 调整 邻近 节点 的 链接 。 


Set 也 是 Collection 的 子 接口 ， 它 没有 增加 新 的 方法 ， 但 保证 不 含 重 
复元 素 。 它 有 两 个 主要 的 实现 类 : HashSet 和 TreeSet。HashSet 基 于 哈 希 
表 实 现 ， 要 求 键 重 写 hashCode 方 法 ， 效 率 更 高 ， 但 元 素 间 没有 顺序 ; 
TreeSet 基 于 排序 二 叉 树 实现 ， 元 素 按 比较 有 序 ， 元 素 需 要 实现 
Comparable 接 口 ， 或 者 创建 TreeSet 时 提供 一 个 Comparator 对 象 。HashSet 
还 有 一 个 子 类 LinkedHashSet 可 以 按 插入 有 序 。 还 有 一 个 针对 枚 举 类 型 的 
实现 类 EnumSet， 它 基于 位 问 量 实现 ， 效 率 很 高 。 












































Queue 是 Collection 的 子 接口 ， 表 示 先 进 先 出 的 队列 ， 在 尾部 添加 ， 
从 头 部 查看 或 删除 。Deque 是 Queue 的 子 接口 ， 表 示 更 为 通用 的 双 端 队 
列 ， 有 明确 的 在 头 或 尾 进 行 查 看 、 添 加 和 删除 的 方法 。 普 通 队 列 有 两 个 
主要 的 实现 类 : LinkedList 和 ArrayDeque。LinkedList 基 于 链表 实现 ， 
ArrayDeque 基 于 循环 数组 实现 。 一 般 而 言 ， 如 果 只 需要 Deque 接 口 ， 
Array-Deque 的 效率 更 高 一 些 。 


Queue 还 有 一 个 特殊 的 实现 类 PriorityQueue， 表 示 优 先 级 队列 ， 内 
部 是 用 推 实现 的 。 堆 除了 用 于 实现 优先 级 队列 ， 还 可 以 高 效 方便 地 解决 
很 多 其 他 问题 ， 比 如 求 前 K 个 最 大 的 元 素 、 求 中 值 等 。 


Map 接 口 表示 键 值 对 集合 ， 经 党 根据 键 进 行 操作 ， 它 有 两 个 主要 的 
实现 类 : HashMap 和 TreeMap。HashMap 基 于 哈 希 表 实 现 ， 要 求 键 重 写 
hashCode 方 法 ， 操 作 效 率 很 高 ， 但 元 素 没有 顺序 。TreeMap 基 于 排序 二 
叉 树 实现 ， 要 求 键 实现 Comparable 接 口 ， 或 提供 一 个 Comparator 对 象 ， 
操作 效率 稍 低 ， 但 可 以 按键 有 序 。 


HashMap 还 有 一 个 子 类 LinkedHashMap， 它 可 以 按 插入 或 访问 有 
序 。 之 所 以 能 有 序 ， 是 因为 每 个 元 素 还 加 入 到 了 一 个 双 同 链表 中 。 如 果 
键 本 来 就 是 有 序 的 ， 使 用 LinkedHashMap 而 非 TreeMap 可 以 提高 效率 。 
按 访 问 有 序 的 特点 可 以 方便 地 用 于 实现 LRU 组 人 存 。 


如 果 键 为 枚 举 类 型 ， 可 以 使 用 专门 的 实现 类 EnumMap， 它 使 用 效 
率 更 高 的 数组 实现 。 


需要 说 明 的 是 ， 除 了 Hashtable、Vector 和 Stack， 我 们 介绍 的 各 种 容 
器 类 都 不 是 线程 安全 的 ， 也 就 是 说 ， 如 果 多 个 线程 同时 读 写 同一 个 容 髓 
对 象 ， 是 不 安全 的 。 如 果 需 要 线程 安全 ， 可 以 使 用 Collections 提 供 的 
synchronizedXXX 方 法 对 容器 对 象 进行 同步 ， 或 者 使 用 线程 安全 的 专门 


此 外 ， 容 器 类 提供 的 迭代 器 都 有 一 个 特点 ， 都 会 在 迭代 中 间 进 行 结 
构 性 变化 检测 ， 如 果 容 器 发 生 了 结构 性 变化 ， 就 会 抛 出 
ConcurrentModificationException， 所 以 不 能 在 从 代 中 间 直 接 调 用 容 右 类 
提供 的 addremove 方 法 ， 如 需 添 加 和 删除 ， 应 调用 迭代 堪 的 相关 方法 。 


在 解决 一 个 特定 问题 时 ， 经 常 需要 综合 使 用 多 种 容器 类 。 比 如 ， 要 
统计 一 本 书 中 出 现 次 数 最 多 的 前 10 个 单词 ， 可 以 先 使 用 HashMap 统 计 每 














个 单词 出 现 的 次 数 ， 再 使 用 TopK 类 用 PriorityQueue 求 前 10 个 单词 ， 或 者 
使 用 Collections 提 供 的 sort 方法 。 


在 之 前 各 节 介 绍 的 例子 中 ， 为 简单 起 见 ， 容 莫 中 的 元 素 类 型 往往 是 
简单 的 ， 但 需要 说 明 的 是 ， 它 们 也 可 以 是 复杂 的 自 定义 类 型 ， 还 可 以 是 
容 莫 类 型 。 比 如 在 一 个 新 闻 应 用 中 ， 表 示 当 天 的 前 十 大 新 闻 可 以 用 一 个 
List 表 示 ， 形 如 List<News>， 而 为 了 表示 每 个 分 类 的 前 十 大 新 闻 ， 可 以 
用 一 个 Map 表 示 ， 键 为 分 类 Category， 值 为 List<News>， 形 如 
Map<Category，List<News>>， 而 表示 每 天 的 每 个 分 类 的 前 十 大 新 闻 ， 
可 以 在 Map 中 使 用 Map， 键 为 日 期 ， 值 也 是 一 个 Map， 形 如 Map<Date， 
Map<Category, List<News>>。 








12.3.2 ”数据 结构 和 算法 


在 容器 类 中 ， 我 们 看 到 了 如 下 数据 结构 的 应 用 : 


) 动态 数组 : ArrayList 内 部 就 是 动态 数组 ，HashMap 内 部 的 链表 
闫 而 是 动态 扩展 的 ，ArrayDeque 和 PriorityQueue 内 部 也 都 是 动态 扩展 
的 数组 。 


2) 链表 :， LinkedList 是 用 双 辐 链表 实现 的 ，HashMap 中 映射 到 同一 
个 链表 数组 的 键 值 对 是 通过 单 癌 链表 链接 起 来 的 ，LinkedHashMap 中 
个 元 素 还 加 入 到 了 一 个 双 同 链表 中 以 维护 插入 或 访问 顺序 。 


3) 哈 硕 表 : HashMap 是 用 哈 希 表 实 现 的 ，HashSet、LinkedHashSet 
和 LinkedHashMap 基 于 HashMap， 内 部 当然 也 是 哈 希 表 。 


4) 排序 二 又 树 : TreeMap 是 用 红 黑 树 〈 基 于 排序 二 叉 树 ) 实现 
的 ，TreeSet 内 部 使 用 TreeMap， 当 然 也 是 红 黑 树 ， 红 黑 树 能 保持 元 素 的 
顺序 有 旦 综合 性 能 很 高 。 


5) 堆 : PriorityQueue 是 用 堆 实 现 的 ， 堆 逻辑 上 是 树 ， 物 理 上 是 动 
态 数组 ， 堆 可 以 高 效 地 解决 一 些 其 他 数据 结构 难以 解决 的 问题 。 


6) 循环 数组 : ArrayDeque 是 用 循环 数组 实现 的 ， 通 过 对 头 尾 变量 
的 维护 ， 实 现 了 高 效 的 队列 操作 。 

















7) 位 同 量 : EnumSet 和 BitSet 是 用 位 同 量 实现 的 ， 对 于 只 有 两 种 状 
态 ， 且 需要 进行 集合 运算 的 数据 ， 使 用 位 癌 量 进行 表示 、 位 运算 进行 处 
理 ， 精 简 且 高 效 。 


ee 
比如 : 








1) 动态 扩展 算法 : 动态 数组 的 扩展 人 策略， 一 般 是 指数 级 扩展 的 ， 
征 在 两 方面 进行 平衡 ， 一 方面 是 希望 减少 内 存 消 耗 ， 忆 一 方面 布 望 减少 
内 存 分 配 、 移 动 和 复制 的 开销 。 


2) 哈 希 算法 : 哈 希 表 中 键 映射 到 链表 数组 索引 的 算法 ， 算 法 要 
快 ， 同 时 要 尽量 随机 和 均匀 。 


3) 排序 二 叉 树 的 平衡 算法 : 排序 二 叉 树 的 平衡 非常 重要 ， 红 黑 树 
是 一 种 平衡 算法 ，AVL 树 是 另 一 种 平衡 算法 。 平 衡 算法 一 方面 要 保证 尽 
量 平衡 ， 另 一 方面 要 尽量 减少 综合 开销 。 

Collections 实 现 了 一 些 通 用 算法 ， 比 如 二 分 查找 、 排 序 、 翻 转 列表 


顺序 、 随 机 化 重 排 等 ， 在 实现 大 部 分 算法 时 ，Collections 也 都 根据 容器 
大 小 和 是 否 实现 了 RandomAccess 接 口 采 用 了 不 同 的 实现 方式 。 














12.3.3 ”设计 思维 和 模式 


在 容器 类 中 ， 我 们 也 看 到 了 Java 的 多 种 语言 机 制 和 设计 思维 的 运 
用 : 








1) 封装 : 封装 就 是 提供 简单 接口 ， 并 隐藏 实现 细节 ， 这 是 程序 设 
计 的 最 重要 思维 。 在 容 需 类 中 ， 很 多 类 、 方 法 和 变量 都 是 私有 的 ， 比 如 
迭代 器 方法 ， 基 本 都 是 通过 私有 内 部 类 或 匿名 内 部 类 实现 的 。 


2) 继承 和 多 态 : 继承 可 以 复 用 代码 ， 便 于 按 父 类 统一 处 理 ， 但 继 
承 是 一 把 双 刃 剑 。 在 容器 类 中 ，Collection 是 父 接 口 ，LisVSeVQueue 继 承 
目 Collection， 通 过 Collection 接 口 可 以 统一 处 理 多 种 类 型 的 集合 对 象 。 
容 右 类 定义 了 很 多 抽象 容器 类 ， 具 体 类 通过 继承 它们 以 复 用 代码 ， 每 个 
抽象 容器 类 都 有 详细 的 文档 说 明 ， 描 述 其 实现 机 制 ， 以 及 子 类 应 该 如 何 
重 写 方法 。 容 器 类 的 设计 展示 了 接口 继承 、 类 继承 ， 以 及 抽象 类 的 恰当 























应 用 。 


3) 组 合 : 一 般 而 言 ， 组 合 应 该 优先 于 继承 ， 我 们 看 到 HashSet 通 过 
组 合 的 方式 使 用 TreeSet 通 过 组 合 使 用 TreeMap， 适 配器 和 并 
饰 器 模式 也 都 是 通过 组 合 实现 的 。 


4) 接口 : 面向 接口 编程 是 一 种 重要 的 思维 ， 可 降低 代码 间 的 厢 
合 ， 提 融 代 码 复 用 程度 ， 在 容 右 类 方法 中 ， 接 受 的 参数 和 返回 值 往往 部 
是 接口 ，Collections 提 供 的 通用 算法 ， 操 作 的 也 都 是 接口 对 象 ， 我 们 平 
和 

用 接口 。 


5) 设计 模式 : 我 们 在 容器 类 中 看 到 了 和 迭代 器 、 工 厂 方法 、 适 配 
项 、 奢 饰 喜 等 多 种 设计 模式 的 应 用 。 


本 节 从 用 法 和 特点 、 数 据 结构 和 算法 以 及 设计 思维 和 模式 三 个 角度 
简要 总 结 了 之 前 介绍 的 各 种 容器 类 。 至 此 ， 关 于 容器 类 就 介绍 完了 。 到 
前 为 止 ， 我 们 还 没有 接触 过 文件 处 理 ， 而 我 们 在 日 常 的 计算 机 操作 
接触 最 多 的 就 是 各 种 文件 了 ， 让 我 们 从 下 一 章 开 始 ， 一 起 探讨 文件 
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第 13 章 ”文件 基本 技术 


我 们 在 日 常 计 算 机 操作 中 ， 接 触 和 处 理 最 多 的 ， 除 了 上 了 网， 大概 就 
征 各 种 各 样 的 文件 了 ， 从 本 章 开 始 ， 我 们 融 来 探讨 文件 处 理 。 文 件 处 理 
的 内 容 比较 多 ， 我 们 先 在 13.1 节 进行 概述 ， 并 介绍 后 续 章 节 的 安排 。 


13.1 文件 概述 


在 本 市 ， 我 们 主要 介绍 文件 有 关 的 一 些 基 本 概念 和 第 识 ，Java 中 处 
理 文件 的 基本 思路 和 类 结构 ， 以 及 接 下 来 的 章节 安排 。 


13.1.1 基本 概念 和 常识 


下 面 ， 我 们 先 介 绍 一 些 基本 概念 和 常识 ， 包 括 二 进 制 思维 、 文 件 类 
型 、 文 本 文件 的 编码 、 文 件 系 统 和 文件 读 写 等 。 


1. 二 进 制 思 维 


为 了 透彻 理解 文件 ， 我 们 首先 要 有 一 个 二 进 制 思维 。 所 有 文件 ， 
不 论 是 可 执行 文件 、 图 片 文 件 、 视 频 文件 、Word 文 件 、 压 缩 文 件 、txt 
文件 ， 都 没什么 可 神秘 的 ， 它 们 都 是 以 0 和 1 的 二 进 制 形式 保存 的 。 我 们 
所 看 到 的 图 片 、 视 频 、 文 本 ， 都 是 应 用 程序 对 这 些 二 进 制 的 解析 结果 。 


作为 程序 员 ， 我 们 应 该 有 一 个 编辑 器 ， 能 得 看 文件 的 二 进 制 形 式 ， 
比如 UltraEdit， 它 文 持 以 十 六 进 制 进行 得 看 和 编辑 。 比 如 ， 一 个 文本 文 
件 ， 看 到 的 内 容 为 : 








hel11o，123， 老 马 


打开 十 六 进 制 编辑 ， 看 到 的 内 容 如 图 13-1 所 示 。 


< 





查找 文本 查找 上 一 个 查找 下 一 个 ”替换 


| hello.txt 四 


J J a: 





00000000h: 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 区 8 80 81 E9 ; hello, 123, BB..é 
00000010h: A9 AC ;© 


图 13-1 使 用 UltraEdit 查 看 十 六 进 制 





左边 的 部 分 就 是 其 对 应 的 十 六 进 制 ，"hello" 对 应 的 十 六 进 制 
是 "68656C 6C 6F"， 对 应 ASCII 码 编号 "104101108108111"，" 蕊 "对 应 的 
十 六 进 制 是 "E9A9AC"， 这 是 " 马 " 的 UTF-8 编 码 。 


2. 文 件 类 型 


虽然 所 有 数据 都 是 以 二 进 制 形式 保存 的 ， 但 为 了 方便 处 理 数 据 ， 高 
级 语言 引入 了 数据 类 型 的 概念 。 文 件 处 理 也 类 似 ， 所 有 文件 都 是 以 二 进 
制 形式 保存 的 ， 但 为 了 便于 理解 和 处 理 文件 ， 文 件 也 有 文件 类 型 的 概 


人 


文件 类 型 通常 以 扩展 名 的 形式 体现 ， 比 如 ，PDF 文 件 类 型 的 扩展 名 
征 .pdf， 图 片 文件 的 一 种 常见 扩展 名 是 pg， 压缩 文件 的 一 种 名 见 扩展 名 
古 .zip。 每 种 文件 类 型 都 有 一 定 的 格式 ， 代 表 着 文件 含义 和 二 进 制 之 间 
的 映射 关系 。 比 如 一 个 Word 文 件 ， 其 中 有 文本 、 图 片 、 表 格 ， 文 本 可 
能 有 颜色 、 字 体 、 字 号 等 ，doc 文 件 类 型 就 定义 了 这 些 内 容 和 二 进 制 表 
示 之 间 的 映射 关系 。 有 的 文件 类 型 的 格式 是 公开 的 ， 有 的 可 能 是 私有 
的 ， 我 们 也 可 以 定义 目 己 私有 的 文件 格式 。 


对 于 一 种 文件 类 型 ， 往 往 有 一 种 或 多 种 应 用 程序 可 以 解读 它 ， 进 行 
查看 和 编辑 ， 一 个 应 用 程序 往往 可 以 解读 一 种 或 多 种 文件 类 型 。 在 操作 
系统 中 ， 一 种 扩展 名 往往 关联 一 个 应 用 程序 ， 比 如 .doc 后 级 关联 Word 应 
用 。 用 户 通 过 双击 试图 打开 茶 扩 展 名 的 文件 时 ， 操 作 系 统 碍 找 关 联 的 应 
用 程序 ， 局 动 该 程序 ， 传 递 该 文件 路 径 给 它 ， 程 序 再 打开 该 文件 。 


需要 说 明 的 是 ， 给 文件 加 正确 的 扩展 名 是 一 种 惯例 ， 但 并 不 是 强制 
的 ， 如 果 扩 展 名 和 文件 类 型 不 匹配 ， 应 用 程序 试图 打开 该 文件 时 可 能 会 
报错 。 男 外 ， 一 个 文件 可 以 选择 使 用 多 种 应 用 程序 进行 解读 ， 在 操作 系 
统 中 ， 一 般 通 过 右键 单 击 文件 ， 选 择 打开 方式 即 可 。 


文件 类 型 可 以 粗略 分 为 两 类 : 一 类 是 文本 文件 ， 另 一 类 是 二 进 制 文 
件 。 文 本 文件 的 例子 有 普通 的 文本 文件 《〈:txzt) ， 程 序 源 代 码 文件 
Cjava) 、HIML 文 件 〈.html) 等 ， 二 进 制 文件 的 例子 有 压缩 文件 
(zip) 、PDF 文 件 〈.pdf) 、MP3 文 件 〈.mp3) 、Excel 文 件 〈.Xlsx) 


= 于 

















基本 上 ， 文 本 文件 里 的 每 个 二 进 制 字 节 都 是 某 个 可 打印 字符 的 一 部 
分 ， 都 可 以 用 最 基本 的 文本 编辑 吉 进 行 查 看 和 编辑 ， 如 Windows 上 的 





notepad、Linux 上 的 vi。 二 进 制 文 件 中 ， 每 个 字 节 束 不 一 定 表示 字符 ， 
可 能 表示 颜色 、 字 体 、 声 音 大 小 等 ， 如 果 用 基本 的 文本 编辑 器 打开 ， 一 
般 都 是 满 屏 的 乱码 ， 需 要 专门 的 应 用 程序 进行 得 看 和 编辑 。 


3. 文 本 文件 的 编码 


对 于 文本 文件 ， 我 们 还 必须 注意 文件 的 编码 方式 。 文 本 文件 中 包含 
的 基本 都 是 可 打印 字符 ， 但 字符 到 二 进 制 的 映射 〈 即 编码 ) 却 有 多 种 方 
式 ， 如 GB18030、UTF-8， 我 们 在 第 2 章 详细 介绍 过 各 种 编码 ， 这 里 就 不 
孝 述 了 。 


对 于 一 个 给 定 的 文本 文件 ， 它 采用 的 是 什么 编码 方式 呢 ? 一 般 而 
言 ， 我 们 是 不 知道 的 。 那 应 用 程序 用 什么 编码 方式 进行 解读 呢 ? 一 般 使 
用 茶 种 默认 的 编码 方式 ， 可 能 是 应 用 程序 默认 的 ， 也 可 能 是 操作 系统 默 
认 的 ， 当 然 也 可 能 采用 一 些 比较 智能 的 算法 目 动 推断 编码 方式 。 


对 于 UTF-8 编 码 的 文件 ， 我 们 需要 特别 说 明 。 有 一 种 方式 ， 可 以 标 
记 该 文件 是 UTF-8 编 码 的 ， 那 就 是 在 文件 最 开头 加 入 三 个 特殊 字 节 
COxEF 0xBB 0xBF) ， 这 三 个 特殊 字 节 被 称 为 BOM 头 ，BOM 是 Byte 
Order Mark〔 即 字 节 序 标记 )〉 的 缩写 。 比 如 ， 对 前 面 的 hello.txt 文 件 ， 带 
BOM 尖 的 UTF-8 编 码 的 十 六 进 制 形式 如 图 13-2 所 示 。 











161 
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十 六 进 制 编辑 


9 


00000000h: EF BB BE 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 FE8 ; ..Rhello, 123, e 
00000010h: 80 81 E9 A9 AC ; . .én 





图 13-2” 带 BOM 头 的 文件 


图 13-1 和 图 13-2 所 示 都 是 UTEF-8 编 码 ， 看 到 的 字符 内 容 也 一 样 ， 但 
二 进 制 内 容 不 一 样 ， 一 个 带 BOM 头 ， 一 个 不 带 BOM 头 。 


需要 注意 的 是 ， 不 是 所 有 应 用 程序 都 支持 带 BOM 头 的 UTF-8 编 码 文 
件 ， 比 如 PHP 就 不 支持 BOM， 如 果 PHP 源 代码 文件 带 BOM 头 ，PHP 运 行 
就 会 出 错 。 碰 到 这 种 问题 时 ， 前 面 介 绍 的 二 进 制 思维 就 特别 重要 ， 不 要 
只 看 文件 的 显示 ， 还 要 看 文件 背后 的 二 进 制 。 





另外 ， 我 们 需要 说 明 下 文本 文件 的 换行 符 。 在 Windows 系 统 中 ， 换 
行 符 一 般 是 两 个 字符 "rna"， 即 ASCII 码 的 13 (Nr) 和 10 (\n') ,在 
Linux 系 统 中 ， 换 行 符 一 般 是 一 个 字符 "\n"。 


4. 文 件 系统 


文件 一 般 是 放 在 硬盘 上 的 ， 一 个 机 器 上 可 能 有 多 个 硬盘 ， 但 各 种 操 
作 系 统 都 会 隐藏 物 理 硬盘 概念 ， 提 供 一 个 逻辑 上 的 统一 结构 。 在 
Windows 中 ， 可 以 有 多 个 逻辑 盘 ， 如 C、D、E 等 ， 每 个 盘 可 以 被 格式 化 
为 一 种 不 同 的 文件 系统 ， 和 常见 的 文件 系统 有 FAT32 和 NTFS。 在 Linux 
中 ， 只 有 一 个 逻辑 的 根 目录 ， 用 和 斜 线 / 表 示 。Linux 支 持 多 种 不 同 的 文件 
系统 ， 如 Ext2/Ext3/Ext4 等 。 不 同 的 文件 系统 有 不 同 的 文件 组 织 方式 、 
结构 和 特点 ， 不 过 ， 一 般 编 程 时 ， 语 言 和 类 库 为 我 们 提供 了 统一 的 
API， 我 们 并 不 需要 关心 其 细节 。 


在 逻辑 上 ，Windows 中 有 多 个 根 目 录 ，Linux 中 有 一 个 根 目 录 ， 
个 根 目 录 下 有 一 棵 子 目 录 和 文件 构成 的 树 。 每 个 文件 都 有 文件 路 径 的 
概念 ， 路 径 有 两 种 形式 : 一 种 是 绝对 路 径 ， 另 一 种 是 相对 路 径 。 


所 谓 绝对 路 径 ， 是 从 根 目 录 开 始 到 当前 文件 的 完整 路 径 ， 在 
Windows 中 ， 目 录 之 间 用 反 笠 线 分 隔 ， 如 C: \code\hello.java， 在 Linux 
中 ， 目 录 之 间 用 和 僚 线 分 隔 ， 如 /Users/laoma/Desktop/code/hello.java。 在 
Java 中 ，java.io.File 类 定义 了 一 个 静态 变量 File.separator， 表 示 路 径 分 隔 
符 ， 编 程 时 应 使 用 该 变量 而 避免 硬 编码 。 


所 谓 相 对 路 径 ， 是 相对 于 当前 目录 而 言 的 。 在 命令 行 终端 上 ， 通 
过 cd 命令 进入 的 目录 束 是 当前 目录 ; 在 Java 中 ， 通 过 
System.getProperty 〈"user.dir") 可 以 得 到 运行 Java 程 序 的 当前 目录 。 相 
对 路 径 不 以 根 目 录 开 头 ， 比 如 在 windows 上 ， 当 前 目录 为 D: Naoma， 
相对 路 径 为 code\hello.java， 则 完整 路 径 为 D: \laoma\code\hello.java。 


每 个 文件 除了 有 有 体内 容 ， 还 有 元 数据 信息 ， 如 文件 名 、 创 建 时 
闻 、 修 改 时 间 、 文 件 大 小 等 。 文 件 还 有 一 个 是 否 隐 藏 的 性 质 。 在 Linux 
系统 中 ， 如 果 文 件 名 以 .开头 ， 则 为 隐藏 文件 ， 在 Windows 系 统 中 ， 隐 茂 
是 文件 的 一 个 属性 ， 可 以 进行 设置 。 


大 部 分 文件 系统 的 文件 和 目录 共有 访问 权限 的 概念 ， 对 所 有 者 、 
用 户 组 可 以 有 不 同 的 权限 ， 有 具体 权限 包括 读 、 写 、 执 行 。 


















































文件 名 有 大 小 写 是 否 敏感 的 概念 。 在 Windows 系 统 中 ， 一 般 是 大 小 
写 不 敏感 的 ， 而 Linux 则 一 般 是 大 小 写 敏感 的 。 也 就 是 说 ， 同 一 个 目录 
下 ，abc.txt 和 ABC.txt 在 Windows 中 被 视 为 同一 个 文件 ， 而 在 Linux 中 则 
被 视 为 不 同 的 文件 。 


操作 系统 中 有 一 个 临时 文件 的 概念 。 临 时 文件 位 于 一 个 特定 目 
录 ， 比 如 Windows 7 中 ， 临 时 文件 一 般 位 于 “C: \Users\ 用 户 名 
\AppData\Local\Temp”; Linux 系 统 中 ， 临 时 文件 位 于 /tmp。 操 作 系 统 会 
有 一 定 的 策略 自动 清理 不 用 的 临时 文件 。 临 时 文件 一 般 不 是 用 户 手 工 创 
建 的 ， 而 是 应 用 程序 产生 的 ， 用 于 临时 目的 。 


5 文件 语 写 


文件 是 放 在 人 硬盘 上 的 ， 程 序 处 理 文件 需要 将 文件 读 入 内 存 ， 修 改 
后 ， 需 要 写 回 硬盘 。 操 作 系统 提供 了 对 文件 读 写 的 基本 API， 不 同 操作 
系统 的 接口 和 实现 是 不 一 样 的， 不 过 ， 有 一 些 共同 的 概念 。Java 封 朔 了 
操作 系统 的 功能 ， 提 供 了 统一 的 API。 


-个 基本 常识 是 ， 便 盘 的 访问 延 时 ， 相 比 内 存 ， 是 很 慢 的 。 操 作 
系统 和 硬盘 一 般 是 按 块 批 量 传输 ， 而 不 是 按 字 节 ， 以 摊 销 延 时 开销 ， 块 
大 小 一 般 至 少 为 512 字 节 ， 即 使 应 用 程序 只 需要 文件 的 一 个 字 节 ， 操 作 
系统 也 会 至 少将 一 个 块 读 进来 。 一 般 而 言 ， 应 尽量 减少 接触 硬盘 ， 接 触 
一 次 ， 就 一 次 多 做 一 些 事情 。 对 于 网 络 请 求 和 其 他 输入 输出 设备 ， 原 则 
都 是 类 似 的 。 


刃 一 个 基本 第 识 是 ;一般 读 写 文件 需要 两 次 数据 复制 ， 比 如 读 文 
件 ， 需 要 先 从 硬盘 复制 到 操作 系统 内 核 ， 再 从 内 核 复制 到 应 用 程序 分 配 
的 内 存 中 。 操 作 系统 运行 所 在 的 环境 和 应 用 程序 是 不 一 样 的， 操作 系统 
所 在 的 环境 是 内 核 态 ， 应 用 程序 是 用 户 态 ， 应 用 程序 调用 操作 系统 的 功 
能 ， 需 要 两 次 环境 的 切换 ， 先 从 用 户 态 切 到 内 核 态 ， 再 从 内 核 态 切 到 用 
户 态 。 这 种 用 户 态 /内 核 态 的 切换 是 有 开销 的 ， 应 尽量 减少 这 种 切换 。 


为 了 提升 文件 操作 的 效率 ， 应 用 程序 经 癌 使 用 一 种 第 见 的 策略 ， 即 
使 用 缓冲 区 。 读 文件 时 ， 即 使 目前 只 需要 少量 内 容 ， 但 预知 还 会 接着 
读 取 ， 就 一 次 读 取 比较 多 的 内 容 ， 放 到 读 缓 冲 区 ， 下 次 读 取 时 ， 如 果 绥 
冲 区 有 ， 束 耻 接 从 缓冲 区 读 ， 减 少 访问 操作 系统 和 人 硬盘 。 写 文件 时 ， 先 
写 到 写 缓冲 区 ， 与 缓冲 区 满 了 之 后 ， 再 一 次 性 调用 操作 系统 写 到 硬盘 。 
不 过 ， 需 要 注意 的 是 ， 在 写 结束 的 时 候 ， 要 记 住 将 绥 冲 区 的 剩余 内 容 同 






































步 到 硬盘 。 操 作 系统 自身 也 会 使 用 缓冲 区 ， 不 过 ， 应 用 程序 更 了 解读 写 
模式 ， 恰 当 使 用 往往 可 以 有 更 高 的 效率 。 


操作 系统 操作 文件 一 般 有 打开 和 关闭 的 概念 。 打 开 文 件 会 在 操作 
系统 内 核 建 立 一 个 有 关 该 文件 的 内 存 结构 ， 这 个 结构 一 般 遂 过 一 个 整数 
索引 来 引用 ， 这 个 索引 一 般 称 为 文件 描述 符 。 这 个 结构 是 消耗 内 存 
的 ， 操 作 系 统 能 同时 打开 的 文件 一 般 也 是 有 限 的 ， 在 不 用 文件 的 时 候 ， 
应 该 记 住 关闭 文件 。 关 闭 文件 一 般 会 同步 缓冲 区 内 容 到 硬盘 ， 并 释放 
占据 的 内 存 结构 。 


操作 系统 一 般 支 持 一 种 称 为 内 存 映射 文件 的 高 效 的 随机 读 写 大 文 
件 的 方法 ， 将 文件 直接 映射 到 内 存 ， 操 作 内 存 就 是 操作 文件 。 在 和 内存 映 
射 文件 中 ， 只 有 访问 到 的 数据 才 会 被 实际 复制 到 内 存 ， 且 数据 只 会 复制 
一 次 ， 和 被 操作 系统 以 及 多 个 应 用 程序 共 孚 。 





13.1.2 ”Java 文件 概述 





在 Java 中 处 理 文 件 有 一 些 基本 概念 和 类 ， 包 括 流 、 装 饰 器 设计 模 
式 、ReadevWriter、 随 机 读 写 文件 、File、NIO、 序 列 化 和 反 序 列 化 ， 下 
面 分 别 介绍 。 


1. 流 





在 Java 中 〈 很 多 其 他 语言 也 类 似 ) ， 文 件 一 般 不 是 单独 处 理 的 ， 而 
是 视 为 输入 输出 〈InpuyoOutput，IO) 设备 的 一 种 。Java 使 用 基本 统一 的 
概念 处 理 所 有 的 IO， 包 括 键入 、 显 示 终 端 、 网 络 等 。 


这 个 统一 的 概念 是 流 ， 流 有 输入 流 和 输出 法 之 分 。 输 入 流 束 是 可 
以 从 中 获取 数据 ， 输 入 流 的 实际 提供 者 可 以 是 键盘 、 文 件 、 网 络 每 ， 输 
出 流 就 是 可 以 同 其 中 写 入 数据 ， 输 出 流 的 实际 目的 地 可 以 是 显示 终端 、 
文件 、 网 络 等 。 

Java IO 的 基本 类 大 多 位 于 包 java.io 中 。 类 InputStream 表 示 输 入 流 ， 
OutputStream 表 示 输 出 流 ， 而 FileInputStream 表 示 文 件 输入 流 ， 
FileOutputStream 表 示 文 件 输出 流 。 


有 了 流 的 概念 ， 就 有 了 很 多 面 癌 流 的 代码 ， 比 如 对 流 做 加 蜜 、 压 


缩 、 计 算 信息 摘要 、 计 算 检验 和 等 ， 这 些 代码 接受 的 参数 和 返回 结果 都 
是 抽象 的 流 ， 它 们 构成 了 一 个 协作 体系 ， 这 类 似 于 之 前 介绍 的 接口 概 

念 、 面 癌 接 口 的 编程 ， 以 及 容器 类 协作 体系 。 一 些 实际 上 不 是 IO 的 数 

据 源 和 目的 地 也 转换 为 了 流 ， 以 方便 参与 这 种 协作 ， 比 如 字 市 数组 ， 也 
包装 为 了 流 ByteArrayInputStream 和 ByteArrayOutputStream 。 


2. 装 饰 器 设计 模式 


基本 的 流 按 字 节 读 写 ， 没 有 绥 冲 区 ， 这 不 方便 使 用 。Java 解 决 这 个 
问题 的 方法 是 使 用 装饰 器 设计 模式 ， 引 入 了 很 多 装饰 类 ， 对 基本 的 流 增 
加 功能 ， 以 方便 使 用 。 一 般 一 个 类 只 关注 一 个 方面 ， 实 际 使 用 时 ， 经 常 
会 需要 多 个 装饰 类 。 

Java 中 有 很 多 装饰 类 ， 有 两 个 基 类 : 过 小 器 输入 流 FilterInputStream 
和 过 滤器 输出 流 FilterOutputStream。 过 滤 类 似 于 自来水 管道 ， 流 入 的 是 
| 功能 不 变 ， 或 者 只 是 增加 功能 。 它 有 很 多 子 类 ， 这 
里 及 站 一 些 : 


1) 对 流 起 缓冲 装饰 的 子 类 是 BufferedInputStream 和 
BufferedOutputStream 。 


2) 可 以 按 8 种 基本 类 型 和 字符 串 对 流 进行 读 写 的 子 类 是 
DataInputStream 和 DataOutput-Stream 。 











3) 可 以 对 流 进 行 压缩 和 解压 缩 的 子 类 有 GZIPInputStream、 
ZipInputStream、 GZIPOutput-Stream 和 ZipOutputStream。 


4) 可 以 将 基本 类 型 、 对 象 输出 为 其 字符 串 表 示 的 子 类 有 


PrintStream 。 


众多 的 装饰 类 使 得 整个 类 结构 变 得 比较 复杂 ， 完 成 基本 的 操作 也 需 
要 比较 多 的 代码 ， 其 优点 是 非常 灵活 ， 在 解决 东 些 问题 时 也 很 优雅 。 


3.Readerv Writer 
以 InputStream/OutputStream 为 其 类 的 流 基本 都 是 以 二 进 制 形式 处 理 


数据 的 ， 不 能 够 方便 地 处 理 文本 文件 ， 没 有 编码 的 概念 ， 能 够 方便 地 按 
字符 处 理 文本 数据 的 基 类 是 Reader 和 Writer， 它 也 有 很 多 子 类 : 

















1) 读 写 文件 的 子 类 是 FileReader 和 FileWriter。 
2) 起 缓冲 装饰 的 子 类 是 BufferedReader 和 BufferedWiriter。 


3) 将 字符 数组 包装 为 Reader/Writer 的 子 类 是 CharArrayReader 和 和 
CharArray Writer。 


4) 将 字符 串 包 装 为 Reader/Writer 的 子 类 是 StringReader 和 
StringWriter。 


5) 将 InputStream/OutputStream 转 换 为 Reader/Writer 的 子 类 是 
InputStreamReader 和 OutputStreamWriter。 


6) 将 基本 类 型 、 对 象 输出 为 其 字符 串 表示 的 子 类 是 PrintWoriter. 
4. 随 机 读 写 文件 


大 部 分 情况 下 ， 使 用 流 或 Reader/Writer 读 写 文件 内 容 ， 但 Java 提 供 
了 一 个 独立 的 可 以 随机 读 写 文件 的 类 RandomAccessFile， 适 用 于 大 小 已 
知 的 记录 组 成 的 文件 。 该 类 在 日 常 应 用 开发 中 用 得 比较 少 ， 但 在 一 些 系 
统 程序 中 用 得 比较 多 。 


5.File 


上 面 介 绍 的 都 是 操作 数据 本 身 ， 而 关于 文件 路 径 、 文 件 元 数据 、 文 
件 目录 、 临 时 文件 、 访 问 权 限 管 理 等 ，Java 使 用 File 这 个 类 来 表示 。 


6.NIO 


以 上 介绍 的 类 基本 都 位 于 包 java.io 下 ，Java 还 有 一 个 关于 IO 操作 的 
包 java.nio，nio 表 示 New IO， 这 个 包 下 同样 包含 大 量 的 类 。 


NIO 代 表 一 种 不 同 的 看 待 IO 的 方式 ， 它 有 缓冲 区 和 通道 的 概念 。 利 
用 缓冲 区 和 通道 往往 可 以 达成 和 流 类 似 的 目的 ， 不 过 ， 它 们 更 接近 操作 
系统 的 概念 ， 某 些 操作 的 性 能 也 更 高 。 比 如 ， 复 制 文件 到 网 络 ， 通 道 可 
以 利用 操作 系统 和 硬件 提供 的 DMA 机 制 (Direct Memory Access， 直 接 
人 ， 不 用 CPU 和 应 用 程序 参与 ， 直 接 将 数据 从 硬盘 复制 到 网 














除了 看 待 方式 不 同 ，NIO 还 文 持 一 些 比较 砌 层 的 功能 ， 如 内 存 映 射 
文件 、 文 件 加 锁 、 目 定义 文件 系统 、 非 阻塞 式 IO、 腊 步 IO 等 。 


不 过 ， 这 些 功能 要 么 是 比较 底层 ， 普 通 应 用 程序 用 到 得 比较 少 ， 要 
么 主要 适用 于 网 络 IO 操作 ， 我 们 大 多 不 会 介绍 ， 只 会 介绍 内 存 映 射 文 
fs 


7. 序 列 化 和 反 序 列 化 


简单 来 说 ， 序 列 化 就 是 将 内 存 中 的 Java 对 象 持久 保存 到 一 个 流 中 ， 
反 序 列 化 就 是 从 流 中 恢复 Java 对 象 到 内 存 。 序 列 化 和 反 序 列 化 主要 有 两 
ne 


Java 主 要 通过 接口 Serializable 和 类 
ObjectInputStream/ObjectOutputStream 提 供 对 序列 化 的 文 持 ， 基 本 的 使 用 
是 比较 简单 的 ， 但 也 有 一 些 复杂 的 地 方 。 不 过 ，Java 的 默认 序列 化 有 一 
些 缺点 ， 比 如 ， 序 列 化 后 的 形式 比较 大 、 当 费 空间 ， 序 列 化 / 反 序 列 化 





XML 是 前 几 年 最 为 流行 的 描述 结构 性 数据 的 语言 和 格式 ，Java 对 象 
也 可 以 序列 化 为 XML 格式 。XML 容 易 阅 读 和 编辑 ， 且 可 以 方便 地 与 其 
他 语言 进行 交互 。XML 强 调 格 式 化 但 比较 “笨重 ”，JSON 是 近 几 年 来 逐 
渐 流 行 的 轻 量 级 的 数据 交换 格式 ， 在 很 多 场合 蔡 代 了 XML， 也 非常 容 
易 阅 读 和 编辑 。Java 对 象 也 可 以 序列 化 为 JSON 格 式 ， 且 与 其 他 语言 进行 


交互 。 


XML 和 JSON 都 是 文本 格式 ， 人 容易 阅读 ， 但 占用 的 空间 相对 大 一 
些 ， 在 只 用 于 网 络 远 程 调用 的 情况 下 ， 有 很 多 流行 的 、 跨 语言 的 、 精 简 
且 高 效 的 对 象 序列 化 机 制 ， 如 ProtoBuf、Thrift、MessagePack 等 。 其 
中 ，MessagePack 是 二 进 制 形式 的 JSON， 更 小 更 快 。 

文件 看 起 来 是 一 件 非常 简单 的 事情 ， 但 实际 却 没有 那么 简单 ，Java 
的 设计 也 不 是 太 和 完美， 包含 了 大 量 的 类 ， 这 使 得 对 于 文件 的 理解 变 得 困 
难 。 为 便于 理解 ， 我 们 将 采用 以 下 思路 在 接 下 来 的 章节 中 进行 探讨 。 


首先 ， 我 们 介绍 如 何 处 理 二 进 制 文件 ， 或 者 将 所 有 文件 看 作 二 进 























制 ， 介 绍 如 何 操作 ， 对 于 第 见 操作 ， 我 们 会 封装 ， 提 供 一 些 简单 易 用 的 
方法 。 下 一 步 ， 我 们 介绍 如 何 处 理 文本 文件 ， 我 们 会 考虑 编码 、 按 行 处 
理 等 ， 同 样 ， 对 于 第 见 操 作 ， 我 们 会 封 朔 ， 提 供 简单 易 用 的 方法 。 接 下 
来 ， 我 们 介绍 文件 本 身 和 目录 操作 File 类 ， 我 们 也 会 封装 常见 操作 。 以 
上 这 些 内 容 是 文件 处 理 的 基本 技术 ， 我 们 会 在 本 半 进 行 讨论 。 


在 日 常 编程 中 ， 我 们 经 常会 需要 处 理 一 些 具体 类 型 的 文件 ， 如 属性 
文件 、CSV 文 件 、Excel 文 件 、HTML 文 件 和 压缩 文件 ， 直 接 使 用 字 节 
流 / 字 符 流 来 处 理 一 般 是 很 不 方便 的 ， 往 往 有 一 些 更 为 高 层 的 API， 关 于 
这 些 ， 我 们 下 章 介 绍 。 此 外 ， 下 章 还 会 介绍 比较 底层 的 对 文件 的 操作 
RandomAccessFile 类 、 内 存 映射 文件 ， 以 及 序列 化 。 文 件 看 上 去 应 该 很 
人 
开始 。 














13.2 二进制 文件 和 字 节 流 


本 节 介 绍 在 Java 中 如 何以 二 进 制 字 节 的 方式 来 处 理 文 件 ， 前 面 我 们 
提 到 Java 中 有 流 的 概念 ， 以 二 进 制 方式 读 写 的 主要 流 有 : 


.InputStreamyOutputStream: 这 是 基 类 ， 它 们 是 抽象 类 。 














:FileInputStream/FileOutputStream: 输入 源 和 输出 目标 是 文件 的 
流 O 


.ByteArrayInputStream/ByteArrayOutputStream: 输入 源 和 输出 目标 
是 字 节 数组 的 流 。 


:DataInputStream/DataOutputStream: 装饰 类 ， 按 基本 类 型 和 字符 串 
而 非 只 是 字 他 读 写 流 。 


.BufferedInputStream/BufferedOutputStream: 装饰 类 ， 对 输入 输出 
流 提供 绥 冲 功能 。 


下 面 ， 我 们 就 来 介绍 这 些 类 的 功能 、 用 法 、 原 理 和 使 用 场景 ， 最 后 
忆 结 一 些 简单 的 实用 方法 。 


13.2.1 InputStream/OutputStream 


我 们 分 别 看 下 InputStream 和 OutputStream。 
1.InputStream 


(1) InputStream 的 基本 方法 





InputStream 是 抽象 类 ， 主 要 方法 是 : 





public abstract int read() throws IOException,; 





read 方 法 从 流 中 读 取 下 一 个 字 节 ， 返 回 类 型 为 int， 但 取 值 为 0 一 





255， 当 读 到 流 结 尾 的 时 候 ， 返 回 值 为 -1， 如 果 流 中 没有 数据 ，read 方 法 
会 阻塞 直到 数据 到 来 、 流 关闭 或 异常 出 现 。 异 常 出 现时 ，read 方 法 抛 出 
异常 ， 类 型 为 IOException， 这 是 一 个 受 检 异 常 ， 调 用 者 必须 进行 处 理 。 
read 是 一 个 抽象 方法 ， 具 体 子 类 必须 实现 ，FileInputStream 会 调用 本 地 
方法 。 所 谓 本 地 方法 ， 一 般 不 是 用 Java 写 的 ， 大 多 使 用 C 语 言 实 现 ， 具 
体 实 现 往往 与 虚拟 机 和 操作 系统 有 关 。 


InputStream 还 有 如 下 方法 ， 可 以 一 次 读 取 多 个 字 市 : 








public int read(byte b[]) throws IOException 





读 入 的 字 节 放 入 参数 数组 b 中 ， 第 一 个 字 节 存 入 b[0]， 第 二 个 存 入 
b[1]， 以 此 类 推 ， 一 次 最 多 读 入 的 字 节 个 数 为 数组 b 的 长 度 ， 但 实际 读 入 
的 个 数 可 能 小 于 数组 长 度 ， 返 回 值 为 实际 读 入 的 字 节 个 数 。 如 果 刚 开始 
读 取 时 已 到 流 结 尾 ， 则 返回 -1; 否则 ， 只 要 数组 长 度 大 于 0， 该 方法 都 
会 尽力 至 少 读 取 一 个 字 节 ， 如 果 流 中 一 个 字 厄 都 没有 ， 它 会 阻塞 ， 异 般 
出 现时 也 是 抛 出 IOException。 该 方法 不 是 抽象 方法 ，InputStream 有 一 个 
默认 实现 ， 主 要 就 是 循环 调用 读 一 个 字 贡 的 read 方 法 ， 但 子 类 如 
FileInputStream 往 往 会 提供 更 为 高 效 的 实现 。 


批量 读 取 还 有 一 个 更 为 通用 的 重 载 方法 : 











public int read(byte b[], int off, int len) throws IOException 





读 入 的 第 一 个 字 节 放 入 b[of， 最 多 读 取 len 个 字 节 ，read (byte 
b[D]) 就 是 调用 了 该 方法 





public int read(byte b[]) throws IOException { 
return read(b, 90, b.length); 
} 





演 读 取 结 束 后 ， 应 该 关闭 ， 以 释放 相关 资源 ， 关 闭 方法 为 : 





public long skip(long n) throws IOException 
public int available() throws IOException 
public synchronized void mark(int readlimit) 
public boolean markSupported() 


public synchronized void reset() throws IOException 





不 管 read 方 法 是 否 抛 出 了 异常 ， 都 应 该 调用 close 方 法 ， 所 以 close 方 
法 通常 应 该 放 在 finally 语 句 内 。close 方 法 自己 可 能 也 会 抛 出 
IOException， 但 通常 可 以 捕获 并 忽略 。 


(2) InputStream 的 高 级 方法 
InputStream 还 定义 了 如 下 方法 : 


skip 跳 过 输入 流 中 n 个 字 节 ， 因 为 输入 流 中 剩余 的 字 节 个 数 可 能 不 到 
n， 所 以 返回 值 为 实际 略 过 的 字 市 个 数 。InputStream 的 默认 实现 就 是 尽 
力 读 取 n 个 字 节 并 扔 挥 ， 子 类 往往 会 提供 更 为 高效 的 实现 ， 
FileInputStream 会 调用 本 地 方法 。 在 处 理 数据 时 ， 对 于 不 感 兴 趣 的 部 
分 ，skip 往 往 比 读 取 然后 扔 掉 的 效率 要 高 。 

available 返 回 下 一 次 不 需要 阻塞 驶 能 读 取 到 的 大 概 字 节 个 数 。 
InputStream 的 默认 实现 是 返回 0， 子 类 会 根据 具体 情况 返回 适当 的 值 ， 
FileInputStream 会 调用 本 地 方法 。 在 文件 读 写 中 ， 这 个 方法 一 般 没什么 
用 ， 但 在 从 网 络 读 取 数 据 时 ， 可 以 根据 该 方法 的 返回 值 在 网 络 有 足够 数 
据 时 才 读 ， 以 避免 阻塞 。 


一 般 的 流 读 取 都 是 一 次 性 的 ， 且 只 能 往 前 读 ， 不 能 往 后 读 ， 但 有 时 
可 能 希望 能 够 完 看 一 下 后 面 的 内 容 ， 根 据 情况 再 重新 读 取 。 比 如 ， 处 理 
一 个 未 知 的 二 进 制 文件 ， 我 们 不 确定 它 的 类 型 ， 但 可 能 可 以 通过 流 的 前 
几 十 个 字 布 判断 出 来 ， 判 读 出 来 后 ， 再 重 置 到 流 开 头 ， 交 给 相应 类 型 的 
代码 进行 处 理 。 


InputStream 定 义 了 三 个 方法 : mark、reset、markSupported， 用 于 文 
持 从 读 过 的 流 中 重复 读 取 。 怎 么 重复 读 取 呢 ? 先 使 用 mark 〈) 方法 将 当 
前 位 置 标 记 下 来 ， 在 读 取 了 一 些 字 节 ， 和 希望 重新 从 标记 位 置 读 时 ， 调 用 
reset 方 法 。 能 够 重复 读 取 不 代表 能 够 回 到 任意 的 标记 位 置 ，mark 方 法 有 
一 个 参数 readLimit， 表 示 在 设置 了 标记 后 ， 能 够 继续 往 后 读 的 最 多 字 市 
数 ， 如 果 超 过 了 ， 标 记 会 无 效 。 为 什么 会 这 样 呢 ? 因 为 之 所 以 能 够 重 
读 ， 是 因为 流 能 够 将 从 标记 位 置 开 始 的 字 节 保存 起 来 ， 而 保存 消耗 的 内 
存 不 能 无 限 大 ， 流 只 保证 不 会 小 于 readLimit。 


不 是 所 有 流 都 支持 mark、reset 方 法 ， 是 否 支 持 可 以 通过 























markSupported 的 返回 值 进 行 判 断 。InpuStream 的 默认 实现 是 不 文 持 ， 
FileInputStream 也 不 直接 文 持 ， 但 BufferedInput-Stream 和 
ByteArrayInputStream 可 以 支持 。 

2.0utputStream 


OutputStream 的 基本 方法 是 : 





public abstract void write(int b) throws IOException,; 





同 流 中 写 入 一 个 字 节 ， 参 数 类 型 虽然 是 int， 但 其 实 只 会 用 到 最 低 的 
8 位 。 这 个 方法 是 抽象 方法 ， 具 体 子 类 必须 实现 ，FileInputStream 会 调用 
相信? 


OutputStream 还 有 两 个 批量 写 入 的 方法 : 








public void write(byte b[]) throws IOException 
public void write(byte b[], int off, int len) throws IOException 








在 第 二 个 方法 中 ， 第 一 个 写 入 的 字 节 是 b[off]， 写 入 个 数 为 len， 最 
后 一 个 是 b[off+len-1]， 第 一 个 方法 等 同 于 调用 write (b，0， 
b.length) ; 。OutputStream 的 默认 实现 是 循环 调用 单字 节 的 write 〈) 方 
实现 ，FileOutpuStream 会 调用 对 应 的 批量 写 
地 方法 。 


OutputStream 还 有 两 个 方法 : 





public void flush() throws IOException 
public void close() throws IOException 








flush 方 法 将 绥 冲 而 未 实际 写 的 数据 进行 实际 写 入 ， 比 如 ， 在 
BufferedOutputStream 中 ， 调 用 flush 方 法 会 将 其 缓冲 区 的 内 容 写 到 其 装饰 
的 流 中 ， 并 调用 该 流 的 flush 方 法 。 基 类 OutputStream 没 有 绥 冲 ，flush 方 
法 代 公 为 荆 ，。 


需要 说 明 的 是 文件 输出 流 FileOutputStream， 你 可 能 会 认为 ， 调 用 





flush 方 法 会 强制 确保 数据 保存 到 硬盘 上 ， 但 实际 上 不 是 这 样 ， 
FileOutputStream 没 有 绥 冲 ， 没 有 重 写 flush 方 法 ， 调 用 flush 方 法 没有 任何 
1 数据 只 是 传递 给 了 操作 系统 ， 但 操作 系统 什么 时 候 保存 到 硬盘 

上 ， 这 是 不 一 定 的 。 要 确保 数据 保存 至 可 以 调用 
FileOutputStream 中 的 特有 方法 ， 有 具体 竺 会 介 纪 


close 方 法 一 般 会 首先 调用 flush 方 法 ， 然 后 再 释放 流 占 用 的 系统 资 
源 。 同 InputStream 一 样 ，close 方 法 一 般 应 该 放 在 finally 语 句 内 。 











13.2.2 FileInputStream/FileOutputStream 


nn FileOutputStream 的 输入 源 和 输出 目标 是 文件 ， 我 
们 分 别 介 


1.FileOutputStream 


FileOutputStream 有 多 个 构造 方法 ， 其 中 两 个 如 下 所 示 : 





public FileoutputStream(File file, boolean append ) 
throws FileNotFoundException 
public FileOutputStream(String name) throws FileNotFoundException 





File 类 型 的 参数 fle 和 字符 串 的 类 型 的 参数 name 都 表示 文件 路 径 ， 路 
径 可 以 是 绝对 路 径 ， 也 可 以 是 相对 路 径 ， 如 采 文 件 已 存在 ，append 参 数 
指定 是 追加 还 是 覆盖 ，true 表 示 追 加 ，false 表 示 履 盖 ， 第 二 个 构造 方法 
没有 append 参 数 ， 表 示 徐 新 。 new 一 个 BileOutputStream 对 象 会 实际 打开 
文件 ， 操 作 系 统 会 分 配 相关 资源 。 如 果 当 前 用 户 没 有 写 权 限 ， 会 抛 出 异 
常 SecurityException， 它 是 一 种 RuntimeException。 如 果 指 定 的 文件 是 一 
个 已 存在 的 目录 ， 或 者 由 于 其 他 原因 不 能 打开 文件 ， 会 抛 出 异常 


FileNotFoundException， 它 是 IOException 的 一 个 子 类 。 


我 们 看 一 段 简单 的 代码 ， 将 字符 串 "hello，123， 老 马 " 写 到 文件 
hello.txt 中 : 

















OutputStream output = new FileOutputStream("hello.txt"); 
try{ 

String data = "hel1o，123， 老 马 "; 

byte[] bytes = data. a forName ("UTF-8")); 


output ,write(bytes ) ， 
}finally{ 
output.close( ); 
} 





OutputStream 只 能 以 byte 或 byte 数 组 写 文 件 ， 为 了 写字 符 串 ， 我 们 调 
用 String 的 get-Bytes 方 法 得 到 它 的 UTF-8 编 码 的 字 节 数组 ， 再 调用 
write〈) 方法 ， 写 的 过 程 放 在 try 语 句 内 ， 在 finally 语 句 中 调用 close 方 


FileOutputStream 还 有 两 个 额外 的 方法 : 





public FileChannel getChannel() 
public final FileDescriptor getFD() 





FileChannel 定 义 在 java.nio 中 ， 表 示 文 件 通道 概念 。 我 们 不 会 深入 介 
绍 通道 ， 但 内 存 映射 文件 方法 定义 在 FileChannel 中 ， 我 们 会 在 下 章 介 
绍 。FileDescriptor 表 示 文 件 描述 符 ， 它 与 操作 系统 的 一 些 文件 内 存 结构 
相连 ， 在 大 部 分 情况 下 ， 我 们 不 会 用 到 它 ， 不 过 它 有 一 个 方法 sync: 











public native void sync() throws SyncFailedException,; 








这 是 一 个 本 地 方法 ， 它 会 确保 将 操作 系统 绥 冲 的 数据 写 到 硬盘 上 。 
注意 与 Output-Stream 的 flush 方 法 相 区 别 ，flush 方 法 只 能 将 应 用 程序 绥 冲 
的 数据 写 到 操作 系统 ，sync 方 法 则 确保 数据 写 到 硬盘 ， 不 过 一 般 情 况 
下 ， 我 们 并 不 需要 手工 调用 它 ， 只 要 操作 系统 和 硬件 设备 没 问 题 ， 数 据 
迟早 会 写 入 。 在 一 定 特定 情况 下 ， 一 定 需 要 确保 数据 写 入 人 硬盘， 则 可 以 
调用 该 方法 。 








2.FileInputStream 





FileInputStream 的 主要 构造 方法 有 : 





public FileInputStream(String name) throws FileNotFoundException 
public FileInputStream(File file) throws FileNotFoundException 





参数 与 FileOutputStream 类 似 ， 可 以 是 文件 路 径 或 File 对 象 ， 但 必须 


是 一 个 已 存在 的 文件 ， 不 能 是 目录 。new 一 个 FileInputStream 对 象 也 会 实 
际 打开 文件 ， 操 作 系 统 会 分 配 相 关 资 源 ， 如 果 文 件 不 存在 ， 会 抛 出 异常 
FileNotFoundException， 如 果 当 前 用 户 没 有 读 的 权限 ， 会 抛 出 异常 
SecurityException。 我 们 看 一 段 简 单 的 代码 ， 将 上 面 写 入 的 文 

件 "hello.txt" 读 到 内 存 并 输出 : 





InputStream input = new FileInputStream("hello.txt"); 
try{ 
byte[] buf = new byte[1024]; 
int bytesRead = input,read(buf) 
String data = new String(buf, 0, bytesRead, "UTF-8"); 
System.out.println(data) ， 
}finally{ 
input.close(); 


} 





读 入 到 的 是 byte 数 组 ， 我 们 使 用 Sting 的 带 编码 参数 的 构造 方法 将 其 
转换 为 了 String。 这 段 代码 假定 一 次 read 调 用 就 读 到 了 所 有 内 容 ， 且 假定 
字 节 长度 不 起 这 1024。 为 了 确保 读 到 所 有 内容， 可 以 到 个 字 节 读 取 直到 





int b = -1; 

int bytesRead = 0; 

while( (b=input.read())!=-1){ 
buf [bytesRead++] = (byte)b; 





在 没有 绥 冲 的 情况 下 逐个 字 节 读 取 性 能 很 低 ， 可 以 使 用 批量 读 入 且 
确保 读 到 结尾 ， 如 下 所 示 : 





byte[] buf = new byte[1024]; 

int off = 0; 

int bytesRead = 0; 

while( (bytesRead=input.read(buf, off, 1024-off ))!=-1){ 
off += bytesRead; 


} 
String data = new String(buf, ©, off, "UTF-8"); 








不 过 ， 这 还 是 假定 文件 内 容 长 度 不 超过 一 个 固定 的 大 小 1024。 如 果 
不 确定 文件 内 容 的 长 度 ， 但 不 希望 一 次 性 分 配 过 大 的 byte 数 组 ， 又 和 希望 
将 文件 内 容 全 部 谈 入 ， 怎 么 做 呢 ? 可 以 借助 ByteArrayOutputStream， 我 
们 下 面 进 行 介绍 。 


13.2.3 ByteArrayInputStream/ByteArrayOutputStream 


它们 的 输入 源 和 输出 目标 是 字 市 数组 ， 我 们 分 别人 介绍。 
1.ByteArrayOutputStream 


ByteArrayOutputStream 的 输出 目标 是 一 个 byte 数 组 ， 这 个 数组 的 长 
度 是 根据 数据 内 容 动 态 扩展 的 ， 它 它 有 两 个 构造 六 法 ， 








public ByteArrayOutputSstream() 
public ByteArrayOutputStream(int size) 








第 二 个 构造 方法 中 的 size 指 定 的 束 是 初始 的 数组 大 小 ， 如 果 没 有 指 
定 ， 则 长 度 为 32。 在 调用 write 方法 的 过 程 中 ， 如 采 数 组 大 小 不 够 ， 会 进 
行 扩 展 ， 扩 展 集 略 同样 是 指数 扩展 ， 每 次 至 少 增加 一 倍 。 


ByteArrayOutputStream 有 如 下 方法 ， 可 以 方便 地 将 数据 转换 为 字 节 
数组 或 字符 串 : 





public synchronized byte[] toByteArray() 
public synchronized String toString() 
public synchronized String toString(String charsetName) 





toString〈) 方法 使 用 系统 默认 编码 。 


ByteArrayOutputStream 中 的 数据 也 可 以 方便 地 写 到 另 一 个 
OutputStream: 





public synchronized void writeTo(OutputStream out) throws IOException 





ByteArrayOutputStream 还 有 如 下 额外 方法 : 





public synchronized int size() 
public synchronized void reset() 








size 方 法 返回 当前 写 入 的 字 节 个 数 。reset 方 法 重 置 字 节 个 数 为 0， 


reset 后 ， 可 以 重用 已 分 配 的 数组 。 


使 用 ByteArrayOutputStream， 我 们 可 以 改进 前 面 的 读 文 件 代 码 ， 确 
保 将 所 有 文件 内 容 谈 入 : 





InputStream input = new FileInputStream("hello.txt"); 
try{ 
ByteArrayOutputStream output = new ByteArrayOutputStream( ) ; 
byte[] buf = new byte[1024]; 
Int bytesRead = 0; 
while( (bytesRead=input,.read(buf))!=-1){ 
output .write(buf, 0, bytesRead); 


} 
String data = output.toString("UTF-8"); 
System.out.printlin(data); 
}finally{ 
input.close(); 





读 入 的 数据 先 写 入 ByteArrayOutputStream 中 ， 读 完 后 ， 再 调用 其 
toString 方 法 获取 完整 数据 。 


2.ByteArrayInputStream 


ByteArrayInputStream 将 byte 数 组 包装 为 一 个 输入 流 ， 是 一 种 适配器 
模式 ， 它 的 构造 方法 有 : 








public ByteArrayInputStream(byte buf[]) 
public ByteArrayInputStream(byte buf[], int offset, int length) 





第 二 个 构造 方法 以 buf 中 offset 开 始 的 length 个 字 节 为 背后 的 数据 。 
ByteArrayInput-Stream 的 所 有 数据 都 在 内 存 ， 文 持 mark/reset 重 复读 取 。 


为 什么 要 将 byte 数 组 转换 为 InputStream 呢 ?这 与 容器 类 中 要 将 数 
组 、 单 个 元 素 转 换 为 容器 接口 的 原因 是 类 似 的 ， 有 很 多 代码 是 以 
InputStream/OutputSteam 为 参数 构建 的 ， 它 们 构成 了 一 个 协作 体系 ， 将 
byte 数 组 转换 为 mputStream 可 以 方便 地 参与 这 种 体系 ， 复 用 代码 。 











13.2.4 DataInputStream/DataOutputStream 


上 面 介绍 的 类 都 只 能 以 字 节 为 单位 读 写 ， 如 何以 其 他 类 型 读 写 呢 ? 
比如 int、double。 可 以 使 用 DataInputStream/DataOutputStream， 它 们 都 
是 装饰 类 。 


1.DataOutputStream 


DataOutputStream 是 装饰 类 基 类 FilterOutputStream 的 子 类 ， 
FilterOutputStream 是 Output-Stream 的 子 类 ， 它 的 构造 方法 是 : 


它 接受 一 个 已 有 的 OutputStream， 基 本 上 将 所 有 操作 都 代理 给 了 
它 。DataOutputStream 实 现 了 DataOutput 接 口 ， 可 以 以 各 种 基本 类 型 和 字 
符 串 写 入 数据 ， 部 分 方法 如 下 : 











void writeBoolean(boolean v) throws IOException; 
void writeInt(int v) throws IOException; 
void writeUTF(String s) throws IOException; 





在 写 入 时 ，DataOutputStream 会 将 这 些 类 型 的 数据 转换 为 其 对 应 的 


1) writeBoolean: 写 入 一 个 字 节 ， 如 果 值 为 tue， 则 写 入 1， 人 否则 
0。 











2) writeInt: 写 入 4 个 字 节 ， 最 高 位 字 节 移 写 入 ， 最 低位 最 后 写 入 。 


3) writeUTF: 将 字符 串 的 UTEF-8 编 码 字 节 写 入 ， 这 个 编码 格式 与 标 
准 的 UTF-8 编 码 略 有 不 同 ， 不 过 ， 我 们 不 用 关心 这 个 细节 。 


与 FilterOutputStream 一 样 ，DataOutputStream 的 构造 方法 也 是 接受 
一 个 已 有 的 Output-Stream: 





public Data0utputStream(OutputStream out) 








我 们 来 看 一 个 例子 ， 保 存 一 个 学 生 列表 到 文件 中 ， 学 生 类 的 定义 


yy 





class Student { 
String name 


int age; 
double score; 
// 省 略 构 造 方法 和 getter/setter 方 法 








学 生 列表 内 容 为 : 





List<Student> students = Arrays.asList(new Student[]{ 
new Student(" 张 三 "，18，80.9d)，new Student(" 李 四 "，17，67.5d) 





}); 





将 该 列表 内 容 写 到 文件 students.dat 中 的 代码 可 以 为 : 





public static void writeStudents(List<Student> students) throws IOException{ 
DataOutputStream output = new Data0utputStream( 
new FileOutputStream("students.dat")); 
try{ 
output .writeInt(Sstudents,Size()); 
for(Student s : Students){ 
output .writeUTF(s.getName( )); 
output .writeInt(s.getAge()); 
output .writeDouble(s.getSscore()); 


} 
}finally{ 
output.close( ); 
} 








我 们 先 写 了 列表 的 长 度 ， 然 后 针对 每 个 学 生 、 每 个 字段 ， 根 据 其 类 
型 调用 了 相应 的 write 方法 。 


2.DataInputStream 


DataInputStream 是 装饰 类 基 类 FilterInputStream 的 子 类 ， 
FilterInputStream 是 Input-Stream 的 子 类 。DataInputStream 实 现 了 


DataInput 接 口 ， 可 以 以 各 种 基本 类 型 和 字符 串 读 取 数 据 ， 部 分 方法 有 : 





boolean readBoolean() throws IOException; 
int readInt() throws IOException; 
String readUTF() throws IOException; 





在 读 取 时 ，DataInputStream 会 先 按 字 市 读 进 来 ， 然 后 转换 为 对 应 的 


型 | 


Eo 


性 


DataInputStream 的 构造 方法 接受 一 个 InputStream: 





public DataInputStream(InputStream in) 








还 是 以 上 面 的 学 生 列表 为 例 ， 我 们 来 看 怎么 从 文件 中 读 进来 : 





public static List<Student> readStudents() throws IOException{ 
DataInputStream input = new DataInputStream( 
new FileInputStream("students.dat")); 
try{ 
int size = input.readInt(); 
List<Student> students = new ArrayList<Student>(size); 
for(int i=0; i<size; I++){ 
Student s = new Student(); 
s.setName(input.readUTF()); 
s.setAge(input.readInt()); 
s.setscore(input.readDouble( )); 
students.add(s); 
} 
return students; 
}finally{ 
input.close(); 





读 基 本 是 写 的 逆 过 程 ， 代 码 比 较 简 单 ， 就 不 袭 述 了 。 使 用 
DataInputStream/DataOutput-Stream 该 写 对 象 ， 非 党 灵活 ， 但 比较 肪 烦 ， 
所 以 Java 提 供 了 序列 化 机 制 ， 我 们 在 下 章 介 绍 。 


13.2.5 BufferedInputStream/BufferedOutputStream 


FileInputStream/FileOutputStream 是 没有 绥 冲 的 ， 按 单个 字 节 读 写 时 
性 能 比较 低 ， 虽 然 可 以 按 字 节 数 组 读 取 以 提高 性 能 ， 但 有 时 必须 要 按 字 
节 读 写 ， 怎 么 解决 这 个 问题 呢 ? 方法 是 将 文件 流 包 装 到 缓冲 流 中 。 
BufferedInputStream 内 部 有 个 字 节 数组 作为 缓冲 区 ， 读 取 时 ， 先 从 这 个 
绥 冲 区 读 ， 绥 冲 区 读 完 了 再 调用 包装 的 流 读 ， 它 的 构造 方法 有 两 个 : 














public BufferedInputStream(InputStream in) 
public BufferedInputStream(InputStream in, int size) 





size 表 示 绥 冲 区 大 小 ， 如 果 没 有 ， 黑 认 值 为 8192。 除 了 提高 性 能 ， 





BufferedInputStream 也 支持 mark/reset， 可 以 重复 读 取 。 与 
BufferedInputStream 类 似 ，BufferedOutputStream 的 构造 方法 也 有 两 个 ， 
默认 的 缓冲 区 大 小 也 是 8192， 它 的 flush 方 法 会 将 缓冲 区 的 内 容 写 到 包装 
的 流 中 。 


在 使 用 FileImputStream/FileOutputStream 时 ， 应 该 几乎 总 是 在 它 的 外 
面包 上 对 应 的 缓冲 类 ， 如 下 所 示 : 





InputStream input = new BufferedInputStream( 
new FileInputStream("hello.txt")); 
OutputStream output = new BufferedoutputStream( 
new FileOutputStream("hello.txt")); 





再 比如 : 





Data0utputStream output = new Data0utputStream( 

new BufferedoutputStream(new FileOutputStream("students.dat"))); 
DataInputStream input = new DataInputStream( 

new BufferedInputStream(new FileInputStream("students.dat"))); 





1326 -二 用 让 法 


可 以 看 出 ， 即 使 只 是 按 二 进 制 字 节 读 写 流 ，Java 也 包括 了 很 多 的 
类 ， 昌 然 很 灵活 ， 但 对 于 一 些 简 单 的 需求 ， 却 需要 写 很 多 代码 。 实 际 开 
发 中 ， 经 钊 需要 将 一 些 音 用 功能 进行 封闭， 提供 更 为 简单 的 接口 。 下 面 
ee 
\ 解 释 了 。 


复制 输入 注 的 内 容 到 输出 流 ， 代 码 为 : 





public static void copy(InputStream input, 
OutputStream output) throws IOException{ 
byte[] buf = new byte[4096]; 
int bytesRead = 0; 
while( (bytesRead = input.read(buf))!=-1)f{ 
output.write(buf, 0, bytesRead); 
} 


} 


ee | 


实际 上 ， 在 Java 9 中 ，InputStream 类 增加 了 一 个 方法 transferTo， 可 
以 实现 相同 功能 ， 实 现 是 类 似 的 ， 有 共 体 代码 为 : 





public long transferTo(OutputStream out) throws IOException { 
Objects.requireNonNull(out, "out"); 
long transferred = 0; 
byte[] buffer = new byte[DEFAULT_BUFFER_SIZE]; //buf 大 小 是 8192 
int read; 
while((read = this.read(buffer, 0, DEFAULT_ BUFFER_ SIZE)) >= 0) { 
out.write(buffer, 0, read); 
transferred += read; 


} 


return transferred; 





站 


将 文件 读 入 字 贡 数组 ， 这 个 方法 调用 了 上 面 的 复制 方法 ， 有 具体 代码 


NA 
. 





public static byte[] readFileToByteArray(String fileName) throws IOException{ 
InputStream input = new FileInputStream(fileName ) ， 
ByteArrayOutputStream output = new ByteArrayOutputStream( ) ; 
try{ 
copy(input, output); 
return output.toByteArray( ); 
}finally{ 
input.close(); 
} 





将 字 市 数组 写 到 文件 ， 代 码 为 : 





public static void writeByteArrayToFile(String fileName, 

byte[] data) throws IOException{ 

OutputStream output = new FileOutputStream(fileName); 

try{ 
output .write(data) 

}finally{ 
output.close( ); 

} 





Apache 有 一 个 类 库 Commons IO， 里 面 提供 了 很 多 简单 易 用 的 方 
法 ， 实 际 开发 中 ， 可 以 考虑 使 用 。 
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本 节 介 绍 了 如 何在 Java 中 以 二 进 制 字 节 的 方式 读 写 文件 ， 介 绍 了 主 
VD 
Lo 


要 的 浙 


1) InputStream/OutputStream: 是 抽象 基 类 ， 有 很 多 面 癌 流 的 代 
码 ， 以 它们 为 参数 ， 比 如 本 节 介 绍 的 copy 方 法 。 


2) FileInputStream/FileOutputStream: 流 的 源 和 目的 地 是 文件 。 


3) ByteArrayInputStream/ByteArrayOutputStream: 源 和 目的 地 是 字 
节 数 组 ， 作 为 输入 相当 于 适配器 ， 作 为 输出 封装 了 动态 数组 ， 便 于 使 
用 。 

4) DataInputStream/DataOutputStream: 装饰 类 ， 按 基本 类 型 和 字符 
品读 写 流 。 


5) BufferedInputStream/BufferedOutputStream: 装饰 类 ， 提 供 组 
* 串 ，FilemputStream/FileOutputStream 一 般 总 是 应 该 用 该 类 装饰 。 


最 后 ， 我 们 提供 了 一 些 实用 方法 ， 以 方便 常见 的 操作 ， 在 实际 开发 
中 ， 可 以 考虑 使 用 专门 的 类 库 ， 如 Apache Commons 
IO (http://commons.apache.org/proper/commons-io/ ) 。 本 节 完 整 的 代码 
在 github 上 ， 地 址 为 https:/github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.file.c57 下 。 


13.3 ”文本 文件 和 字符 流 


上 节 介绍 了 如 何以 字 节 流 的 方式 处 理 文件 ， 对 于 文本 文件 ， 字 节 流 
没有 编码 的 概念 ， 不 能 按 行 处 理 ， 使 用 不 太 方便 ， 更 适合 的 是 使 用 字符 
流 ， 本 节 就 来 介绍 字符 流 。 


我 们 首先 简要 介绍 文本 文件 的 基本 概念 、 与 二 进 制 文件 的 区 别 、 编 
码 ， 以 及 字符 流 和 字 节 流 的 区 别 ， 然 后 介绍 Java 中 的 主要 字符 流 ， 它 们 


省 ， 








1) Reader/Writer: 字符 流 的 基 类 ， 它 们 是 抽象 类 ; 





2) InputStreamReader/OutputStreamWriter: 适配器 类 ， 将 字 节 流转 
换 为 字符 流 ; 


3) FileReader/FileWriter: 输入 源 和 输出 目标 是 文件 的 字符 流 ; 


4) CharArrayReader/CharArrayWriter: 输入 源 和 输出 目标 是 char 数 
组 的 字符 流 ; 

5) StringReader/StringWriter: 输入 源 和 输出 目标 是 String 的 字符 
流 ; 

6) BufferedReader/BufferedWriter: 装饰 类 ， 对 输入 /输出 流 提 供 组 
冲 ， 以 及 按 行 读 写 功 能 ; 

7) PrintWriter: 装饰 类 ， 可 将 基本 类 型 和 对 象 转换 为 其 字符 串 形式 
输出 的 类 。 


除了 这 些 类 ，Java 中 还 有 一 个 类 Scanner， 类 似 于 一 个 Reader， 但 不 
是 Reader 的 子 类 ， 可 以 读 取 基本 类 型 的 字符 串 形式 ， 类 似 于 PrintWriter 
的 逆 操 作 。 理 解 了 字 节 流 和 字符 流 后 ， 我 们 介绍 Java 中 的 标准 输入 输出 
和 错误 流 。 最 后 ， 我 们 总 结 一 些 简单 的 实用 方法 。 


13.3.1 基本 概念 


我 们 先 来 看 一 些 基 本 概念 ， 包 括 文 本 文件 、 编 码 和 字符 流 。 
1. 文 本 文件 
上 节 提 到 ， 处 理 文件 要 有 二 进 制 思 维 。 从 二 进 制 角 度 ， 我 们 通过 


一 个 简单 的 例子 解释 下 文本 文件 与 二 进 制 文 件 的 区 别 。 比 如 ， 要 存储 整 
数 123， 使 用 二 进 制 形式 保存 到 文件 testdat， 代 码 为 : 








Data0utputStream output = new Data0utputStream( 
new FileOutputStream("test.dat")); 

try{ 
output ,writeInt(123) 

}finally{ 
output.close( ); 





使 用 UltraEdit 打 开 该 文件 ， 显 示 的 却 是 : 








打开 十 六 进 制 编辑 器 ， 显 示 如 图 13-3 所 示 。 


J Ct : 


00000000h: 00 00 00 7B[ >? 。。。{ 





= 一 


图 13-3 ”整数 123 的 二 进 制 存 储 


在 文件 中 存储 的 实际 有 4 个 字 节 ， 最 低位 字 市 7B 对 应 的 十 进 制 数 是 
123， 也 就 是 说 ， 对 int 类 型 ， 二 进 制 文件 保存 的 直接 就 是 int 的 二 进 制 形 
式 。 这 个 二 进 制 形式 ， 如 有 果 当 成 字符 来 解释 ， 显 示 成 什么 字符 则 与 编码 
有 关 ， 如 果 当 成 UTF-32BE 编 码 ， 解 释 成 的 就 是 一 个 字符 ， 即 {。 


如 宁 使 用 文本 文件 保存 整数 123， 则 代码 为 : 




















OutputStream output = new FileOutputStream("test.txt"); 
try{ 
String data = Integer ,toString(123) ， 
output.write(data.getBytes("UTF-8")); 


}finally{ 
output.close( ); 


} 





代码 将 整数 123 转 换 为 字符 串 ， 然 后 将 它 的 UTF-8 编 码 输出 到 了 文 
件 中 ， 使 用 Ultra-Edit 打 开 该 文件 ， 显 示 的 就 是 期 望 的 : 








打开 十 六 进 制 编辑 器 ， 显 示 如 图 13-4 所 示 。 


test.txt 四 


本 
放 了 23 


图 13-4 整数 123 的 文本 存储 


文件 中 实际 存储 的 有 三 个 字 节 : 31、32、33， 对 应 的 十 进 制 数 分 别 
是 49、50、51， 分 别 对 应 字符 1'、'2'、'3' 的 ASCII 编 码 。 








2. 编 码 


在 文本 文件 中 ， 编 码 非常 重要 ， 同 一 个 字符 ， 不 同 编码 方式 对 应 的 
二 进 制 形式 可 能 是 不 一 样 的 。 我 们 看 个 例子 ， 对 同样 的 文本 : 








hello，123， 老 马 





1) UTF-8 编 码 ， 十 六 进 制 如 图 13-5 所 示 。 


nt eh a nd de Se J ES ES 3 
00000000h: 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 E8 80 81 E9 ; hello, 123, 8..é 
; 6@n 
[4 





00000010h: A9 AC 医 
图 13-5 ”示例 文本 的 UTF-8 编 码 
英文 和 数字 字符 每 个 占 一 个 字 节 ， 而 每 个 中 文 占 三 个 字 节 。 


2) GB18030 编 码 ， 十 六 进 制 如 图 13-6 所 示 。 





00000000h: 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 C0 CF C2 ED ; hello, 123, AiA1 
00000010h: [ 


图 13-6 ”示例 文本 的 GB18030 编 码 


英文 和 数字 字符 与 UTF-8 编 码 是 一 样 的 ， 但 中 文 不 一 样 ， 每 个 中 文 
占 两 个 字 节 。 


3) UTF-16BE 编 码 ， 十 六 进 制 为 如 图 13-7 所 示 。 


00000000h: 00 68 00 65 00 6C 00 6C 00 6F 00 2C 00 20 00 31 ; .h.e.1.1.0.,. .1 


00000010h: 00 32 00 33 00 2C 00 20 80 01 9A 6C [L | er 





图 13-7 示例 文本 的 UTF-16BE 编 码 


无 化 是 英信 还 是 中 文字 人行 ， 每 个 字符 都 占 两 个 字 节 。UTEF-16BE 也 
是 Java 内 存 中 对 字符 的 编码 方式 。 





3. 字 符 流 


字 节 流 是 按 字 节 读 取 的 ， 而 学 符 流 则 是 按 char 读 取 的 ， 一 个 char 在 
文件 中 保存 的 是 几 个 学 市 与 编码 有 关 ， 但 字符 流 封 效 了 这 种 细节 ， 我 们 
操作 的 对 象 就 是 char。 


需要 说 明 的 是 ， 一 个 char 不 完全 等 同 于 一 个 字符 ， 对 于 绝 大 部 分 字 
符 ， 一 个 字符 就 是 一 个 char， 但 我 们 之 前 介绍 过 ， 对 于 增补 字符 集中 的 
字符 ， 需 要 两 个 char 表 示 ， 对 于 这 种 字符 ，Java 中 的 字符 流 是 按 char 而 
不 是 一 个 完整 字符 处 理 的 。 


理解 了 文本 文件 、 编 码 和 字符 流 的 概念 ， 我 们 再 来 看 Java 中 的 相关 
类 ， 从 基 类 开始 。 























13.3.2 Reader Writer 


Reader 与 字 市 流 的 InputStream 类 似 ， 也 是 抽象 类 ， 部 分 主要 方法 
有 : 





public int read() throws IOException 

public int read(char cbuf[]) throws IOException 
abstract public void close() throws IOException 
public long skip(long n) throws IOException 
public boolean ready() throws IOException 








方法 的 名 称 和 含义 与 InputStream 中 的 对 应 方法 基本 类 似 ， 但 Reader 
中 处 理 的 单位 是 char， 比 如 read 该 取 的 是 一 个 char， 取 值 范 围 为 0 一 
65535。Reader 没 有 available 方 法 ， 对 应 的 方法 是 ready () 。 





Writer 与 字 节 流 的 OutputStream 类 似 ， 也 是 抽象 类 ， 部 分 主要 方法 
有 : 





public void write(int c) 

public void write(char cbuf[]) 

public void write(String str) throws IOException 
abstract public void close() throws IOException; 
abstract public void flush() throws IOException; 








含义 与 OutputStream 的 对 应 方法 基本 类 似 ， 但 Writer 处 理 的 单位 是 
char，Writer 还 接受 String 类 型 ， 我 们 知道 ，String 的 内 部 惑 是 char 数 组 ， 
处 理 时 ， 会 调用 String 的 getChar 方 法 先 获取 char 数 组 。 


13.3.3 InputStreamReader/OutputStreamW riter 


InputStreamReader 和 OutputStreamWriter 是 适配器 类 ， 能 将 
InputStream/OutputStream 转 换 为 Reader/Writer。 


1.O0utputStream Writer 


OutputStreamWriter 的 主要 构造 方法 为 : 





public OutputStreamwriter(OutputStream out, String charsetName) 





一 个 重要 的 参数 是 编码 类 型 ， 可 以 通过 名 字 charsetName 或 Charset 
对 象 传 入 ， 如 果 没 有 传 入 ， 则 为 系统 默认 编码 ， 默 认 编码 可 以 通过 
Charset.defaultCharset 〈() 得 到 。Output-StreamWriter 内 部 有 一 个 类 型 为 
StreamEncoder 的 编码 堪 ， 能 将 char 转 换 为 对 应 编码 的 字 节 。 


我 们 看 一 段 简单 的 代码 ， 将 字符 串 "hello，123， 老 马 " 写 到 文件 
hello.txt 中 ， 编 码 格 式 为 GB2312: 





Writer writer = new OutputStreamwriter( 
new FileOutputSstream("hello.txt"), "GB2312"); 
try{ 
String str = "hel1o，123， 老 马 " | 
writer .write(str); 
}finally{ 
writer.close(); 





创建 一 个 FileOutputStream， 然 后 将 其 包 在 一 个 OutputStreamWiriter 
中 ， 就 可 以 直接 以 字符 串 写 入 了 。 





2.InputStreamReader 


InputStreamReader 的 主要 构造 方法 为 : 





public InputStreamReader(InputStream in) 
public InputStreamReader(InputStream in, String charsetName) 





与 OutputStreamWriter 一 样 ， 一 个 重要 的 参数 是 编码 类 型 。 
InputStreamReader 内 部 有 一 个 类 型 为 StreamDecoder 的 解码 器 ， 能 将 字 节 
根据 编码 转换 为 char。 


我 们 看 一 段 简单 的 代码 ， 将 上 面 写 入 的 文件 读 进 来 : 





Reader reader = new InputStreamReader( 
new FileInputStream("hello.txt"), "GB2312"); 

try{ 

char[] cbuf = new char[1024]; 

int charsRead = reader,read(cbuf ) ，; 

System,out .println(new String(cbuf, ©0, charsRead)); 
}finally{ 

reader .close( ); 
} 





这 段 代 人 码 假定 一 次 read 调 用 就 读 到 了 所 有 内 容 ， 且 假定 长 度 不 超过 
1024。 为 了 确保 读 到 所 有 内 容 ， 可 以 借助 竺 会 介绍 的 CharArrayWriter 或 
StringWriter。 


13.3.4 FileReader/FileWriter 


FileReader/FileWriter 的 输入 和 日 的 是 文件 。FileReader 是 
InputStreamReader 的 子 类 ， 它 的 主要 构造 方法 有 : 








public FileReader(File file) throws FileNotFoundException 
public FileReader(String fileName) throws FileNotFoundException 








FileWriter 是 OutputStreamWriter 的 子 类 ， 它 的 主要 构造 方法 有 : 





public Filewriter(File file) throws IOException 
public Filewriter(String fileName, boolean append) throws IOException 





append 参 数 指 定 是 妃 加 还 是 窗 六 ， 如 果 没 传 ， 则 为 宪 新 。 
需要 注意 的 是 ，FileReader/FileWriter 不 能 指定 编码 类 型 ， 只 能 使 用 


默认 编码 ， 如 果 需 要 指定 编码 类 型 ， 可 以 使 用 
InputStreamReader/OutputStream Writer。 


13.3.5 CharArrayReader/CharArrayWriter 


CharArrayWriter 与 ByteArrayOutputStream 类 似 ， 它 的 输出 目标 是 
char 数 组 ， 这 个 数组 的 长 度 可 以 根据 数据 内 容 动 态 扩展 。 


CharArrayWriterx 有 如 下 方法 ， 可 以 方便 地 将 数据 转换 为 char 数 组 或 
字符 串 : 








public char[] tocharArray() 
public String toString() 





使 用 CharArrayWriter， 我 们 可 以 改进 上 面 的 读 文件 代码 ， 确 保 将 所 
有 文件 内 容 读 入 : 





Reader reader = new InputStreamReader( 
new FileInputStream("hello.txt"), "GB2312"); 
try{ 


CharArrayWriter writer = new CharArraywriter(); 

char[] cbuf = new char[1024]; 

int charsRead = 0; 

while( (charsRead=reader .read(cbuf))!=-1){ 
writer.write(cbuf, ©0, charsRead); 


System.out.println(writer.toSstring()); 
}finally{ 
reader .close( ); 





读 入 的 数据 先 写 入 CharArrayWriter 中 ， 读 完 后 ， 再 调用 其 
toString 〈) 方法 获取 完整 数据 。 


CharArrayReader 与 上 节 介 绍 的 ByteArrayInputStream 类 似 ， 它 将 char 
数组 包装 为 一 个 Reader， 是 一 种 适配器 模式 ， 它 的 构造 方法 有 : 











public CharArrayReader(char buf[]) 
public CharArrayReader(char buf[], int offset, int Jength ) 





13.3.6 StringReader/StringWriter 


StringReader/StringWriter 与 CharArrayReader/CharArrayWriter 类 似 ， 
只 是 输入 源 为 String， 输 出 目标 为 StringBuffer， 而 且 ， 
String/StringBuffer 内 部 是 由 char 数 组 组 成 的 ， 所 以 它们 本 质 上 是 一 样 
的 ， 上 基体 我 们 就 不 帝 述 了 。 之 所 以 要 将 char 数 组 和 String 与 Reader/Writer 
J 换 ， 也 是 为 了 能 够 方便 地 参与 Reader/Writer 构 成 的 协作 体系 ， 复 





13.3.7 BufferedReader/BufferedWriter 


BufferedReader/BufferedWriter 是 装饰 类 ， 提 供 缓 冲 ， 以 及 按 行 读 写 
功能 。Buffered-Writer 的 构造 方法 有 : 





public Bufferedwriter(Writer out) 
public Bufferedwriter(Writer out, int sz) 





参数 sz 是 缓冲 大 小 ， 如 果 没 有 提供 ， 默 认为 8192。 它 有 如 下 方法 ， 


可 以 输出 平台 特定 的 换行 符 : 





public void newLine() throws IOException 





BufferedReader 的 构造 方法 有 : 





public BufferedReader (Reader in) 
public BufferedReader (Reader in, int sz) 





参数 sz 是 缓冲 大 小 ， 如 果 没 有 提供 ， 默 认为 8192。 它 有 如 下 方法 ， 
可 以 读 入 一 行 : 





public String readLine() throws IOException 





I 
Wy 
虹 


字符 "Tr 或 \n' 或 \nn' 被 视 为 换行 件 ，readLine 返 回 一 日 不 会 


包含 换行 符 ， 当 读 到 流 结 尾 时 ， 返 回 null。 


FileReaderFileWriter 是 没有 缓冲 的 ， 也 不 能 按 行 读 写 ， 所 以 ， 一 般 
应 该 在 它们 的 外 面包 上 对 应 的 缓冲 类 。 我 们 来 看 个 例子 ， 还 是 学 生 列 
表 ， 这 次 我 们 使 用 可 读 的 文本 进行 保存 ， 一 行 保存 一 条 学 生 信 息 ， 学 生 
字段 之 则 用 逗号 分 隔 ， 保 存 的 代码 为 : 














public static void writeStudents(List<Student> students) throws IOException{ 
Bufferedwriter writer = null; 
try{ 
writer = new Bufferedwriter(new Filewriter("students.txt")); 
for(Student s : Students){ 
writer.write(s.getName()+","+s.getAge()+","+s.getScore()); 
writer.newLine( ); 


} 
}finally{ 
if(writer!=null){ 
writer.close(); 
} 


} 
} 





保存 后 的 文件 内 容 显 示 为 : 





张 三 , 18, 80.9 


李 四 ,17,，67.5 





从 文件 中 读 取 的 代码 为 : 





public static List<Student> readStudents() throws IOException{ 
BufferedReader reader = null; 
try{ 
reader = new BufferedReader( 
new FileReader("students.txt")); 
List<Student> students = new ArrayList<>(); 
String line = reader.readLine(); 
while(line!=nul]l){ 
String[] fields = line.split(","); 
Student s = new Student(); 
s.setName(fields[0]); 
s.setAge(Integer.parseInt(fields[1])); 
s.setSscore(Double.parseDouble(fields[2])); 
students.add(s); 
line = reader.readLine(); 


return students; 
}finally{ 
if(reader!=null){ 
reader .close( )， 
} 





使 用 readLine 读 入 每 一 行 ， 然后 使 用 String 的 方法 分 隔 字 段 ， 再 调用 
Integer 和 Double 的 方法 将 字符 串 转 换 为 int 和 onle 。 这 种 对 每 一 行 的 解 
析 可 以 使 用 类 Scanner 进 行 简 化 ， 竺 会 我 们 介绍 。 


13.3.8 PrintWriter 


PrintWriter 有 很 多 重 载 的 print 方 法 ， 如 : 





public void print(int i) 
public void print(Object obj) 





会 将 这 些 参数 转换 为 其 字符 串 形 式 ， 即 调用 String.valueOf 〈) ， 
然后 再 润 用 wiite。 它 也 有 很 多 重 载 形式 的 println 方 法 ， printin 除 了 调用 
对 应 的 print， 还 会 输出 一 个 换行 符 。 除 此 之 外 ，PrintWriter 还 有 格式 化 
输出 方法 ， 如 : 





public Printwriter printf(String format, Object ... args) 





format 表 示 格 式 化 形式 ， 比 如 ， 保 留 小 数 点 后 两 位 ， 格 式 可 以 为 : 





Printwriter writer = .… 
writer.format("%.2f", 123.456f); 





输出 为 : 





123.45 





更 多 格式 化 的 内 容 可 以 参看 API 文 要 ， 本 节 就 不 獒 述 了 。 


PrintWriter 的 方便 之 处 在 于 ， 它 有 很 多 构造 方法 ， 可 以 接受 文件 路 
径 名 、 文 件 对 象 、OutputStream、Writer 等 ， 对 于 文件 路 径 名 和 File 对 
象 ， 还 可 以 接受 编码 类 型 作为 参数 ， 比 如 : 








public Printwriter(File file) throws FileNotFoundException 
public Printwriter(String fileName, String csn) 

public Printwriter(OutputStream out, boolean autoFlush) 
public Printwriter(writer out) 





参数 csn 表 示 编 码 类 型 ， 对 于 以 文件 对 象 和 文件 名 为 参数 的 构造 方 
法 ，PrintWriter 内 部 会 构造 一 个 BufferedWriter， 比 如 : 





public Printwriter(String fileName) throws FileNotFoundException { 
this(new Bufferedwriter(new OutputStreamwriter( 
new FileOutputStream(fileName))), false); 





对 于 以 OutputSream 为 参数 的 构造 方法 ，PrintWriter 也 会 构造 一 个 
BufferedWriter， 比 如 : 





public Printwriter(OutputStream out, boolean autoFlush) { 
this(new Bufferedwriter(new OutputStreamwriter(out)), autoFlush); 





对 于 以 Writer 为 参数 的 构造 方法 ，PrintWriter 束 不 会 包装 
BufferedWriter 了。 


构造 方法 中 的 autoFlush 参 数 表示 同步 缓冲 区 的 时 机 ， 如 果 为 true， 
则 在 调用 printIn、printf 或 format 方 法 的 时 候 ， 同 步 缓冲 区 ， 如 果 没 有 
传 ， 则 不 会 自动 同步 ， 需 要 根据 情况 调用 flush 方 法 。 

可 以 看 出 ，PrintWriter 是 一 个 非常 方便 的 类 ， 可 以 直接 指定 文件 名 
作为 参数 ， 可 以 指定 编码 类 型 ， 可 以 自动 缓冲 ， 可 以 目 动 将 多 种 类 型 转 
换 为 字符 串 ， 在 输出 到 文件 时 ， 可 以 优先 选择 该 类 。 


上 面 的 保存 学 生 列 表 代 码 ， 使 用 PrintWriter， 可 以 写 为 : 

















public static void writeStudents(List<Student> students) throws IOException{ 
Printwriter writer = new Printwriter("students.txt"); 


try{ 
for(Student s : students){ 
writer.println(s.getName()+","+s.getAge()+","+s.getScore()); 


} 
}finally{ 
writer.close(); 
} 


} 





PrintWriterx 有 一 个 非常 相似 的 类 PrintStream， 除 了 不 能 接受 Writer 作 
为 构造 方法 外 ，PrintStream 的 其 他 构造 方法 与 PrintWriter 一 样 。 
PrintStream 也 有 几乎 一 样 的 重 载 的 print 和 println 方 法 ， 只 是 自动 同步 绥 
冲 区 的 时 机 略 有 不 同 ， 在 PrintStream 中 ， 只 要 磁 到 一 个 换行 字符 \n'， 就 
会 自动 同步 缓冲 区 。PrintStream 与 PrintWriter 的 男 一 个 区 别 是 ， 虽 然 它 
们 都 有 如 下 方法 : 





public void write(int b) 





但 含义 是 不 一 样 的 ，PrintStream 只 使 用 最 低 的 8 位 ， 输 出 一 个 字 
节 ， 而 PrintWriter 是 使 用 最 低 的 两 位 ， 输 出 一 个 char。 


13.3.9 Scanner 


Scanner 是 一 个 单独 的 类 ， 它 是 一 个 简单 的 文本 扫 揪 器 ， 能 够 分 析 


基本 类 型 和 字符 串 ， 它 需要 一 个 分 陋 符 来 将 不 同 数据 区 分 开 来 ， 默 认 是 
使 用 空白 符 ， 可 以 通过 useDelimiter 〈) 方法 进行 指定 。Scanner 有 很 多 
形式 的 next〈) 方法 ， 可 以 读 取 下 一 个 基本 类 型 或 行 ， 如 : 





public float nextFloat() 
public int nextInt() 
public String nextLine() 





Scanner 也 有 很 多 构造 方法 ， 可 以 接受 File 对 象 、InputStream、 
Reader 作 为 参数 ， 它 也 可 以 将 字符 串 作为 参数 ， 这 时 ， 它 会 创建 一 个 
StringReader。 比 如 ， 以 前 面 的 解析 学 生 记 录 为 例 ， 使 用 Scanner， 代 码 
可 以 改 为 : 





public static List<Student> readStudents() throws IOException{ 
BufferedReader reader = new BufferedReader( 
new FileReader("students.txt")); 
try{ 
List<Student> students = new ArrayList<Student>( ) ; 
String line = reader.readLine(); 
while(1Line!=nulJ) 攻 
Student s = new Student() 
Scanner Scanner = new Scanner(line).useDelimiter(","); 
S,.SetName(Scanner .next( ) )， 
S,SetAge(Scanner ,nextInt() )， 
S,SetScore(Scanner ,nextDoub]le())， 
students.add(s); 
line = reader.readLine(); 


return students,; 
}finally{ 
reader .close( ); 





13.3.10 ”标准 流 


我 们 之 前 一 直 在 使 用 System.out 向 屏幕 上 输出 ， 它 是 一 个 
PrintStream 对 象 ， 输 出 目标 就 是 所 谓 的 “标准 ?输出 ， 经 常 是 屏幕 。 除 了 
System.out，Java 中 还 有 两 个 标准 流 : System.in 和 System.err。 


System.in 表 示 标 准 输入 ， 它 是 一 个 InputStream 对 象 ， 输 入 源 经 常 是 
键盘 。 比 如 ， 从 键盘 接受 一 个 整数 并 输出 ， 代 码 可 以 为 : 





Scanner in = new Scanner(System.in); 
int num = in.nextInt(); 
System.out.println(num); 





System.err 表 示 标 准 错误 流 ， 一 般 异 单 和 错误 信息 输出 到 这 个 流 ， 
它 也 是 一 个 Print-Stream 对 象 ， 输 出 目标 默认 与 System.out 一 样 ， 一 般 也 
时 一 
是 屏 和 大。 


标准 流 的 一 个 重要 特点 是 ， 它 们 可 以 章 定 同 ， 比 如 可 以 重 定向 到 
文件 ， 从 文件 中 接受 输入 ， 输 出 也 写 到 文件 中 。 在 Java 中 ， 可 以 使 用 
System 类 的 setIn、setOut、setErr 进 行 重 定向 ， 比 如 : 





System,SetIn(new ByteArrayInputStream("hello".getBytes("UTF-8"))); 
System,.setOut(new PrintStream("out.txt")); 
System,.setErr(new PrintStream("err.txt")); 
try{ 
Scanner in = new Scanner(System.in); 
System.out.println(in.nextLine( )); 
System.out.println(in.nextLine( )); 
}catch(Exception e){ 
System.err.printlin(e.getMessage( )); 


} 





标准 输入 重 定向 到 了 一 个 ByteArrayInputStream， 标 准 输出 和 错误 重 
定向 到 了 文件 ， 所 以 第 一 次 调用 in.nextLine 就 会 读 取 到 "hello"， 输 出 文 
件 out.txt 中 也 包含 该 字符 串 ， 第 二 次 调用 in.nextLine 会 触发 异常 ， 异 和 常 消 
息 会 写 到 错误 流 中 ， 即 文件 err.txt 中 会 包含 异常 消息 ， 为 "No line 
found"。 


在 实际 开发 中 ， 经 各 需要 重 定 癌 标 准 流 。 比 如 ， 在 一 些 目 动 化 程序 
中 ， 经 第 需要 重 定 同 标 准 输入 流 ， 以 从 文件 中 接受 参数 ， 自 动 执 行 ， 避 
人 免 人 手工 输入 。 在 后 台 运 行 的 程 友 中 ， 一 般 都 需要 重 定 同 标 准 输 出 和 错 
误 流 到 日 志文 件 ， 以 记录 和 分 析 运 行 的 状态 和 问题 。 


在 Linux 系 统 中 ， 标 准 输入 输出 流 也 是 一 种 重要 的 协作 机 制 。 很 多 
命令 都 很 小 ， 只 完成 单一 功能 ， 实 际 完成 一 项 工作 经 党 需要 组 合 使 用 多 
条 命令 ， 它 们 协作 的 模式 就 是 通过 标准 输入 输出 流 ， 每 个 命令 都 可 以 从 
标准 输入 接受 参数 ， 处 理 结果 写 到 标准 输出 ， 这 个 标准 输出 可 以 连接 到 
下 一 个 命令 作为 标准 输入 ， 构 成 管道 式 的 处 理 链条 。 比 如 ， 玛 找 一 个 日 
志文 件 access.log 中 127.0.0.1 出 现 的 行 数 ， 可 以 使 用 命令 : 


























cat access.1og | grep 127.0.0.1 | wc -1 





有 三 个 程序 cat、grep、wc，| 古 管道 符 写 ， 它 将 cat 的 标准 输出 重 定 
回 为 了 grep 的 标准 输入 ， 而 grep 的 标准 输出 又 成 了 wc 的 标准 输入 。 
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可 以 看 出 ， 字 符 流 也 包含 了 很 多 的 类 ， 虽 然 很 灵活 ， 但 对 于 一 些 简 
单 的 需求 ， 却 需要 写 很 多 代码 ， 实 际 开发 中 ， 经 常 需要 将 一 些 第 用 功能 
进行 封装 ， 提 供 更 为 简单 的 接口 。 下 面 我 们 提供 一 些 实用 方法 ， 以 供 参 
考 ， 人 代码 比较 简单 ， 就 不 解释 了 。 


复制 Reader 到 Writer， 代 码 为 : 





public static void copy(final Reader input, 
final Writer output) throws IOException { 
char[] buf = new char[4096]; 
int charsRead = 0; 
while((charsRead = input.read(buf)) != -1) { 
output .write(buf, 0, charsRead); 
} 


} 





人 上 字符 串 ， 参 数 为 文件 名 和 编码 类 型 ， 代 





public static String readFileToString(final String fileName, 
final String encoding) throws IOException{ 
BufferedReader reader = null; 
try{ 
reader = new BufferedReader(new InputStreamReader( 
new FileInputStream(fileName), encoding)); 
Stringwriter writer = new Stringwriter(); 
copy(reader, writer); 
return writer.toString()， 
}finally{ 
if(reader!=null){ 
reader .close( ); 
} 


} 





这 个 方法 利用 了 StringWriter， 并 调用 了 上 面 的 复制 方法 。 


要 将 字符 串 写 到 文件 ， 参 数 为 文件 名 、 字 符 串 内 容 和 编码 类 型 ， 代 码 





public static void writeStringToFile(final String fileName, 
final String data, final String encoding) throws IOException { 


Writer writer = null; 


try{ 
= new OutputStreamwriter( 


writer = 
new FileOutputStream(fileName), encoding); 
writer .write(data); 
}finally{ 
if(writer!=null){ 
writer.close(); 


} 








0 0 





public static void writeLines(final String fileName, final String encoding, 
final Collection<?> lines) throws IOException { 
Printwriter writer = null; 


try{ 
writer = new Printwriter(fileName, encoding); 


for(Object line : lines){ 
writer.printlin(line); 


} 
}finally{ 
if(writer!=null1){ 
writer.close(); 


} 





按 行 将 文件 内 容 读 到 一 个 列表 中 ， 参 数 为 文件 名 、 编 码 类 型 ， 代 码 





public static List<String> readLines(final String fileName, 
final String encoding) throws IOException{ 


BufferedReader reader = null; 


try{ 
reader = new BufferedReader(new InputStreamReader( 
new FileInputStream(fileName), encoding)); 
List<String> list = new ArrayList<>(); 
String line = reader.readLine(); 
while(line!=nul]l){ 


list.add(line); 
line = reader.readLine(); 


return lJist; 
}finally{ 
if(reader!=null){ 
reader .close( );， 
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本 市 介绍 了 如 何在 Java 中 以 字符 流 的 方式 读 写 文本 文件 ， 我 们 强调 
了 二 进 制 思维 、 文 本 文本 与 二 进 制 文件 的 区 别 、 编 码 ， 以 及 字符 流 与 字 
节 流 的 不 同 ， 介 绍 了 个 各 种 字符 流 、Scanner 以 及 标准 流 ， 最 后 总 结 了 
一 些 实用 方法 。 完 整 的 代码 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma .file.c58 
Ts 





写 文件 时 ， 可 以 优先 考虑 PrintWriter， 因 为 它 使 用 方便 ， 支 持 自动 
缓冲 、 指 定编 码 类 型 、 类 型 转换 等 。 读 文件 时 ， 如 果 需 要 指定 编码 类 
型 ， 需 要 使 用 InputStreamReader; 如 果 不 需 要 指定 编码 类 型 ， 可 使 用 
FileReader， 但 都 应 该 考虑 在 外 面包 上 绥 冲 类 Buffered-Reader。 


通过 前 面 两 个 小 节 ， 我 们 应 该 可 以 从 容 地 读 写 文件 内 容 了 ， 但 文件 
和 目录 本 喘 的 操作 ， 如 查看 元 数据 信息 、 文 件 重 命名 、 过 历 文件 、 碍 找 
文件 、 新 建 目 录 等 ， 又 该 如 何 进行 呢 ? 让 我 们 下 节 介 绍 。 





13.4 文件 和 目录 操作 


文件 和 目录 操作 最 终 是 与 操作 系统 和 文件 系统 相关 的 ， 不 同系 统 的 
实现 是 不 一 样 的 ， 但 Java 中 的 java.io.File 类 提供 了 统一 的 接口 ， 底 层 会 
通过 本 地 方法 调用 操作 系统 和 文件 系统 的 具体 实现 ， 本 节 ， 我 们 就 来 介 
绍 File 类 。 Me TR WI 文件 元 数据 、 文 件 操作 、 
目录 操作 ， 在 介绍 这 些 操作 之 前 ， 我 们 先 来 看 下 File 的 构造 方法 。 


13 才 ,1 构造 方法 








File 既 可 以 表示 文件 ， 也 可 以 表示 目录 ， 它 的 主要 构造 方法 有 : 





//pathname 表 示 完 整 路 径 ， 该 路 径 可 以 是 相对 路 径 ， 也 可 以 是 绝对 路 径 
public File(String pathname ) 

//parent 表 示 父 目录 ，chi1d 表 示 孩 子 

public File(String parent, String child) 

public File(File parent, String child) 


























File 中 的 路 径 可 以 是 已 经 存在 的 ， 也 可 以 是 不 存在 的 。 通 过 new 新 
建 一 个 File 对 象 ， 不 会 实际 创建 一 个 文件 ， 只 是 创建 一 个 表示 文件 或 目 
录 的 对 象 ，new 之 后 ，EFile 对 象 中 的 路 径 是 不 可 变 的 。 


13.4.2 ”文件 元 数据 





文件 元 数据 主要 包括 文件 名 和 路 径 、 文 件 基 本 信息 以 及 一 些 安全 和 
权限 相关 的 信息 。 文 件 名 和 路 径 相 关 的 主要 方法 有 : 


























public String getName() // 返 回 文件 或 目录 名 称 ， 不 含 路 径 名 
public boolean isAbsolute() // 判 断 File 中 的 路 径 是 否 是 绝对 路 径 
public String getPath() // 返 回 构造 File 对 象 时 的 完整 路 径 名 ， 包 括 路 径 和 文件 名 称 

















public String getAbsolutePath() // 返 回 完整 的 绝对 路 径 名 

// 返 回 标准 的 完整 路 径 名 ， 它 会 去 掉 路 径 中 的 元 余 名 称 如 "."," . ."， 跟 踪 软 链接 (Unix 系 统 概念 ) 等 
public String getCanonicalpath() throws IOException 

public String getParent() // 返 回 父 目 录 路 径 

public File getParentFile() // 返 回 父 目录 的 File 对 象 

// 返 回 一 个 新 的 File 对 象 ， 新 的 File 对 象 使 用 getAbsolutePath( ) 的 返回 值 作为 参数 构造 
public File getAbsoluterFile() 

// 返 回 一 个 新 的 File 对 象 ， 新 的 File 对 象 使 用 getcanonicalPath( ) 的 返回 值 作为 参数 构造 
public File getCanonicalFile() throws IOException 






























































”这 些 方法 比较 直观 ， 我 们 就 不 解释 了 。File 类 中 有 4 个 静态 变量 ， 表 
示 路 径 分 隔 符 ， 它 们 是 : 





public static final String separator 
public static final char SeparatorChar 
public static final String pathSeparator 
public static final char pathSeparatorChar 





separator 和 separatorChar 表 示 文 件 路 径 分 隔 符 ， 在 Windows 系 统 中 ， 
一 般 为 \，Linux 系 统 中 一 般 为 /。pathSeparator 和 pathSeparatorChar 表 示 
多 个 文件 路 径 中 的 分 隅 符 ， 比 如 ， 环 境 变量 PATH 中 的 分 隔 符 ，Java 类 
路 径 变量 classpath 中 的 分 隔 符 ， 在 执行 命令 时 ， 操 作 系 统 会 从 PATH 指 
定 的 目录 中 寻找 命令 ，Java 运 行 时 加 载 class 文 件 时 ， 会 从 classpath 指 定 
的 路 径 中 寻找 类 文件 。 在 Windows 系 统 中 ， 这 个 分 隔 符 一 般 为 '; '， 在 
Linux 系 统 中 ， 这 个 分 隅 符 一 般 为 ':'。 


We 和 路 径 ，File 对 象 还 有 如 下 方法 ， 以 获取 文件 或 目录 的 



































public boolean exists() // 文 件 或 目录 是 否 存 在 
public boolean isDirectory() // 是 否 为 目录 
public boolean isFile() // 是 否 为 文件 
public long length() // 文 件 长 度 ， 字 节 数 ， 对 目录 没有 意义 

public long lastModified() // 最 后 修改 时 间 ， 从 纪元 时 开始 的 毫秒 数 

public boolean setLastModified(long time) // 设 置 最 后 修改 时 间 ， 返 回 是 否 修改 成 功 












































需要 说 明 的 是 ，File 对 象 没有 返回 创建 时 间 的 方法 ， 因 为 创建 时 间 
不 是 一 个 公共 概念 ，Linux/Unix 就 没有 创建 时 间 的 概念 。 


File 类 中 与 安全 和 权限 相关 的 主要 方法 有 : 








public boolean isHidden() // 是 否 为 隐藏 文件 
public boolean canExecute() // 是 否 可 执行 
public boolean canRead() // 是 否 可 读 
public boolean canwrite() // 是 否 可 写 
public boolean setReadonly() // 设 置 文件 为 只 读 文 件 

// 修 改 文件 读 权限 

public boolean setReadable(boolean readable, boolean ownerOnly) 
public boolean setReadable(boolean readable) 

// 修 改 文件 写 权 限 

public boolean SetwWritable(boolean writable, boolean owneronly) 
public boolean setwritable(boolean writable) 






































// 修 改 文件 可 执行 权限 
public boolean setExecutable(boolean executable, boolean owneronly) 
public boolean setExecutable(boolean executable) 





在 修改 方法 中 ， 如 果 修 改 成 功 ， 返 回 true， 人 否则 返回 false。 在 设置 
权限 方法 中 ，owner-Only 为 true 表 示 只 针对 owner， 为 false 表 示 针 对 所 有 
用 户 ， 没 有 指定 ownerOnly 的 方法 中 ，ownerOnly 相 当 于 是 true。 


13.4.3 “文件 操作 


文件 操作 主要 有 创建 、 删 除 、 重 命名 。 
新 建 一 个 File 对 象 不 会 实际 创建 文件 ， 但 如 下 方法 可 以 : 





public boolean createNewFile() throws IOException 





创建 成 功 返 回 true， 否 则 返回 false， 新 创建 的 文件 内 容 为 空 。 如 果 
文件 已 存在 ， 不 会 创建 。 


File 对 象 还 有 两 个 静态 方法 ， 可 以 创建 临时 文件 : 





public static File createTempFile(String prefix, String suffix) 
throws IOException 

public static File createTempFile(String prefix, String suffix, 
File directory) throws IOException 





临时 文件 的 完整 路 径 名 是 系统 指定 的 、 唯 一 的 ， 但 可 以 通过 参数 指 
定 前 缀 (prefixz) 、 后 级 (suffix) 和 目录 (directory) 。prefix 是 必需 
的 ， 且 至 少 要 三 个 字符 ; suffix 如 果 为 null， 则 默认 为 .tmp; directory 如 
果 不 指定 或 指定 为 null， 则 使 用 系统 默认 目录 。 


File 类 的 删除 方法 为 : 





public boolean delete() 
public void deleteOnExit() 





delete 删 除 文件 或 目录 ， 删 除 成 功 返回 true， 人 否则 返回 false。 如 果 





File 是 目录 且 不 为 空 ， 则 delete 不 会 成 功 ， 返 回 false， 换 名 话说， 要 删除 
目录 ， 先 要 删除 目录 下 的 所 有 子 目 录 和 文件 。deleteOnExit 将 File 对 象 加 
入 到 待 删 列表 ， 在 Java 虚 拟 机 正常 退出 的 时 候 进 行 实际 删除 。 


File 类 的 重 命 名 方法 为 : 








public boolean renameTo(File dest) 





参数 dest 代 表 重 命名 后 的 文件 ， 重 命名 能 侍 成 功 与 系统 有 关 ， 返 回 
值 代表 是 否 成 功 。 


13.4.4 ”目录 操作 


m 当 File 对 象 代表 目录 时 ， 可 以 执行 目录 相关 的 操作 ， 如 创建 、 遍 
力 。 


有 两 个 方法 用 于 创建 目录 : 





public boolean mkdir() 
public boolean mkdirs() 





它们 都 是 创建 目录 ， 创 建成 功 返 回 true， 失 败 返 回 false。 需 要 注意 
的 是 ， 如 果 目 录 已 存在 ， 返 回 值 是 false。 这 两 个 方法 的 区 别 在 于 : 如 果 
某 一 个 中 间 父 目录 不 存在 ， 则 mkdir 会 失败 ， 返 回 false， 而 mkdirs 则 会 创 
建 必 需 的 中 间 父 目录 。 


有 如 下 方法 访问 一 个 目录 下 的 子 目录 和 文件 : 








public String[] list() 

public String[] list(FilenameFilter filter) 
public File[] listFiles() 

public File[] listFiles(FileFilter filter) 
public File[] listFiles(FilenameFilter filter) 














它们 返回 的 都 是 直接 子 目 录 或 文件 ， 不 会 返回 子 目 录 下 的 文件 。 
list 返 回 的 是 文件 名 数组 ， 而 listFiles 返 回 的 是 File 对 象 数 组 。 


FilenameFilter 和 FileFilter 都 是 接口 ， 用 于 过 滤 ，FileFilter 的 定义 为 : 





public interface FileFilter { 
boolean accept(File pathname); 


} 





FilenameFilter 的 定义 为 : 





public interface FilenameFilter { 
boolean accept(File dir, String name); 


} 





在 过 有 历 子 目 录 和 文件 时 ， 针 对 每 个 文件 ， 会 调用 FilenameFilter 或 
FileFilter 的 accept 方 法 ， 只 有 accept 方 法 返回 true 时 ， 才 将 该 子 目 录 或 文 
件 包含 到 返回 结果 中 。Filename-Filter 和 FileFilter 的 区 别 在 于 : FileFilter 
的 accept 方 法 参数 只 有 一 个 File 对 象 ， 而 File-nameFilter 的 accept 方 法 参数 
有 两 个 ，dir 表 示 父 目录 ，name 表 示 子 目录 或 文件 名 。 我 们 来 看 个 例 
子 ， 列 出 当前 目录 下 的 所 有 扩展 名 为 .txt 的 文件 ， 代 码 可 以 为 : 








File f = new File("."); 
File[] files = f.listFiles(new FilenameFilter(){ 
Q@Override 
public boolean accept(File dir, String name) { 
if(name.endswith(".txt")){ 
return true; 


return false; 
} 
}); 





我 们 创建 了 个 FilenameFilter 的 匿名 内 部 类 对 象 并 传递 给 了 listFiles。 


使 用 裔 历 方法 ， 可 以 方便 地 进行 递归 人 裔 历 ， 完 成 一 些 更 为 高 级 的 功 
人 计算 一 个 目录 下 的 所 有 文件 的 大 小 (包括 子 目 录 ) ， 代 码 可 
以 为 : 





public static long sizeOfDirectory(final File directory) { 
long size = 0; 
if(directory.isFile()) { 
return directory.1length(); 
} else { 
for(File file : directory.listFiles()) { 


if(file.isFile()) { 
size += file, length()， 
} else { 
size += sizeOfDirectory(file); 


} 


return size; 





再 如 ， 在 一 个 目录 下 ， 碍 找 所 有 给 定 文件 名 的 文件 ， 代 码 可 以 为 : 





public static Collection<File> findFile(final File directory, 
final String fileName) { 
List<File> files = new ArrayList<>(); 
for(File f : directory.listFiles()) { 
if(f.isFile() && f.getName().equals(fileName)) { 
files.add(f); 
} else if(f.isDirectory()) { 
files.addAll(findFile(f, fileName)); 


return files; 





前 面 介绍 了 File 类 的 delete 方 法 ， 我 们 提 到 ， 如 果 要 删除 目录 而 目录 
不 为 室 ， 需 要 先 清空 目录 ， 利 用 所 历 方 法 ， 我 们 可 以 写 一 个 删除 非 空 目 
录 的 方法 ， 代 码 可 以 为 : 





public static void deleteRecursively(final File file) throws IOException { 
if(file.isFile()) { 
if(!file.delete()) { 
throw new IOException("Failed to delete " 
+ file,getCanonicalPath( ) )， 


} 
} else if(file.isDirectory()) { 
for(File child : file.listFiles()) { 
deleteRecursively(child); 


} 
if(!file.delete()) { 
throw new IOException("Failed to delete " 
+ file,getCanonicalPath( )); 





完整 的 代码 在 github 上 ， 地 址 为 https://github.com/swiftma/program- 
logic ， 位 于 包 shuo.laoma.file.c59 下。 人 至此， 关于 File 类 就 介绍 完了 ， 
File 类 封装 了 操作 系统 和 文件 系统 的 差异 ， 提 供 了 统一 的 文件 和 目录 


API。 
关于 文件 处 理 的 基本 技术 ， 包 括 文件 的 基本 概念 、 二 进 制 文件 与 字 


节 流 、 文 本 文件 与 字符 流 ， 以 及 文件 和 目录 操作 ， 人 至此， 我 们 就 介绍 完 
了 。 下 一 章 ， 我 们 来 看 文件 处 理 相 关 的 一 些 高 级 技术 。 








第 14 半 ”文件 高 级 技术 

在 日 常 编 程 中 ， 我 们 经 常会 需要 处 理 一 些 具 体 类 型 的 文件 ， 如 属性 
文件 、CSV、Excel、HTML 和 压缩 文件 ， 直 接 使 用 上 一 章 介 绍 的 方式 来 
处 理 一 般 是 很 不 方便 的 。 一 些 第 三 方 的 类 库 基 于 之 前 介绍 的 技术 提供 了 
更 为 方便 易 用 的 接口 ， 本 章 会 简要 介绍 这 几 种 文件 类 型 的 处 理 。 

上 一 章 介 绍 了 字 节 流 和 字符 流 ， 它 们 都 是 以 流 的 方式 读 写 文件 ， 流 
的 方式 有 几 个 限制 : 


1) 要 么 读 ， 要 么 写 ， 不 能 同时 读 和 写 。 


2) 不 能 随机 读 写 ， 只 能 从 头 读 到 尾 ， 且 不 能 重复 读 ， 虽 然 通过 绥 
冲 可 以 实现 部 分 重读 ， 但 是 有 限制 。 


Java 中 还 有 一 个 类 RandomAccessFile， 它 没有 这 两 个 限制 ， 既 可 以 
读 ， 也 可 以 写 ， 还 可 以 随机 读 写 ， 是 一 个 更 接近 于 操作 系统 API 的 封装 
光 


入 














访问 文件 还 有 一 种 方式 : 内 存 映射 文件 ， 它 可 以 高 效 处 理 非 第 大 的 
文件 ， 而 且 可 以 被 多 个 不 同 的 应 用 程序 共 圣 ， 特 别 适合 用 于 不 同 应 用 程 
序 之 间 的 通信 。 


在 前 面 章节 ， 我 们 在 将 对 象 保 存 到 文件 时 ， 使 用 的 是 
DataOutputStream， 从 文件 读 入 对 象 时 ， 使 用 的 是 DataInputStream， 使 
用 它们 ， 需 要 逐个 处 理 对 象 中 的 每 个 字段 ， 我 们 提 到 ， 这 种 方式 比较 哆 
嗪 ，Java 中 有 一 种 更 为 简单 的 机 制 ， 那 就 是 序列 化 。 


Java 的 标准 序列 化 机 制 有 一 些 重要 的 限制 ， 而 且 不 能 跨 语言 ， 实 践 
中 经 常 使 用 一 些 蔡 代 方 案 ， 比 如 XML/JSON/MessagePack。Java SDK 中 
对 这 些 格式 的 支持 有 限 ， 有 很 多 第 三 方 的 类 库 提供 了 更 为 方便 的 支持 ， 
Jackson 是 其 中 一 种 ， 它 支持 多 种 格式 。 


本 章 主 要 就 来 介绍 以 上 这 些 技 术 ， 具 体 分 为 5 个 小 节 : 14.1 节 介绍 
几 种 常见 文件 类 型 的 处 理 ，14.2 节 介绍 RandomAccessFile， 演 示 它 的 一 
个 应 用 ， 实 现 一 个 人 简单 的 键 值 对 数据 库 ，14.3 节 介绍 内 存 映 射 文件 ， 演 
示 它 的 一 个 应 用 ， 设 计 和 实现 一 个 简单 的 、 持 久 化 的 、 跨 程序 的 消息 队 











列 ; 14.4 市 介绍 Java 标 准 序列 化 机 制 ，14.5 市 介绍 利用 Jackson 序 列 化 为 
XML/JSON/MessagePack.。 





14.1 第 见 文件 类 型 处 理 


本 节 简 要 介绍 如 何 利用 Java API 和 一 些 第 三 方 类 库 ， 来 处 理 如 下 5 种 
类 型 的 文件 : 


1) 属性 文件 : 属性 文件 是 常见 的 配置 文件 ， 用 于 在 不 改变 代码 的 
情况 下 改变 程序 的 行为 。 


2) CSV: CSV 是 Comma-Separated Values 的 缩写 ， 表 示 喜 号 分 隔 
值 ， 是 一 种 非常 常见 的 文件 类 型 。 大 部 分 日 志文 件 都 是 CSV，CSV 也 经 
常用 于 交换 表格 类 型 的 数据 ， 待 会 我 们 会 看 到 ，CSV 看 上 去 很 简单 ， 但 
处 理 的 复杂 性 经 常 被 低估 。 


3) Excel: 在 编程 中 ， 经 各 需要 将 表格 类 型 的 数据 导出 为 Excel 格 
a 、 也 经 常 需 要 接受 Excel 类 型 的 文件 作为 输入 以 批 
量 导 入 数据 。 


4) HTML: 所 有 网 页 都 是 HTML 格 式 ， 我 们 经 常 需 要 分 析 HTML 网 
页 ， 以 从 中 提取 感 兴趣 的 信息 。 


5) 压缩 文件 : 压缩 文 件 有 多 种 格式 ， 也 有 很 多 压缩 工具 ， 大 部 分 
情况 下 ， 我 们 可 以 借助 工具 而 不 需要 目 己 写 程序 处 理 压缩 文件 ， 但 东 些 
情况 下 ， 需 要 目 己 编程 压缩 文件 或 解压 缩 文件 。 






































14.1.1 属性 文件 


属性 文件 一 般 很 简单 ， 一 行 表示 一 个 属性 ， 属 性 就 是 键 值 对 ， 键 和 
值 用 等 号 (=) 或 冒号 (: ) 分 隔 ， 一 般 用 于 配置 程序 的 一 些 参数 。 在 
需要 连接 数据 库 的 程序 中 ， 经 常 使 用 配置 文件 配置 数据 库 信 息 。 比 如 ， 
设 有 文件 config.properties， 内 容 大 概 如 下 所 示 : 


db.host = 192.168.10.100 
db.port : 3306 
db.username = zhangsan 
db,password = mima1234 





处 理 这 种 文件 使 用 字符 流 是 比较 容易 的 ， 但 Java 中 有 一 个 专门 的 类 
java.util.Properties， 它 的 使 用 也 很 简单 ， 有 如 下 主要 方法 : 





public synchronized void load(InputStream inStream) 
public String getProperty(String key) 
public String getProperty(String key, String defaultValue) 





load 用 于 从 流 中 加 载 属 性 ，getProperty 用 于 获取 属性 值 ， 可 以 提供 
一 个 默认 值 ， 如 果 没 有 找到 配置 的 值 ， 则 返回 默认 值 。 对 于 上 面 的 配置 
文件 ， 可 以 使 用 类 似 下 面 的 代码 进行 读 取 : 





Properties prop = new Properties(); 

prop.load(new FileInputStream("config.properties")); 

String host = prop.getProperty("db.host"); 

int port = Integer.valueOof(prop.getProperty("db.port", "3306")); 





使 用 类 Properties 处 理 属性 文件 的 好 处 是 : 

可 以 目 动 处 理 空格 ,分隔 符 = 前 后 的 空格 会 被 自动 忽略 。 

可 以 自动 忽略 空 行 。 

` 可 以 添加 注释 ， 以 字符 # 或 ! 开头 的 行 会 被 视 为 注释 ， 进 行 忽略 。 
使 用 Properties 也 有 限制 ， 它 不 能 直接 处 理 中 文 ， 在 配置 文件 中 ， 所 


有 非 ASCI 字 符 需 要 使 用 Unicode 编 码 。 比如 ， 不 能 在 配置 文件 中 直接 
这 人 么 与 : 





name= 老 马 





“ 老 马 ”需要 替换 为 Unicode 编 码 ， 如 下 所 示 : 





name=\u8001\u9A6C 





在 Java IDE《〈 如 Eclipse) 中 ， 如 果 使 用 属性 文件 编辑 器 ， 它 会 自动 
蔡 换 中 文 为 Unicode 编 码 ， 如 果 使 用 其 他 编辑 器 ， 可 以 先 写成 中 文 ， 然 
后 使 用 JDK 提 供 的 命令 native2ascii 转 换 为 Unicode 编 码 。 用 法 如 下 例 所 





native2ascii -encoding UTF-8 native.properties asclili,properties 





native.properties 是 输入 ， 其 中 包含 中 文 ; ascii.properties 是 输出 ， 中 
文 蔡 换 为 了 Unicode 编 码 ，-encoding 指 定 输 入 文件 的 编码 ， 这 里 指定 为 
J 了 UTF-8。 


14.1.2 ”CSV 文件 











CSV 是 Comma-Separated Values 的 缩写 ， 表 示 运 号 分 隔 值 。 一 般 而 
言 ， 一 行 表示 一 条 记录 ， 一 条 记录 包含 多 个 字段 ， 字 段 之 间 用 去 号 分 
隅 。 不 过 ， 一 般 而 言 ， 分 隅 符 不 一 定 是 逗号 ， 可 能 是 其 他 字符 ， 如 tab 
符 \t、 冒 号 ':'、 分 写 '; ' 等 。 程序 中 的 各 种 日 志文 件 通 常 是 CSV 文 件 ， 
在 导入 导出 表格 类 型 的 数据 时 ，CSV 也 是 经 常用 的 一 种 格式 。 


CSV 格 式 看 上 去 很 简单 。 比 如 ， 我 们 在 上 一 章 保 存 学 生 列 表 时 ， 使 
用 的 就 是 CSV 格 式 : 


























张 三 , 18, 80 .9 
李 四 ,17, 67 ,5 








使 用 之 前 介绍 的 字符 流 ， 看 上 去 就 可 以 很 容易 处 理 CSV 文 件 ， 按 行 
读 取 ， 对 每 一 行 ， 使 用 String.split 进 行 分 隔 即 可 。 但 其 实 CSV 有 一 些 复 
杂 的 地 方 ， 最 重要 的 是 : 


字段 内 容 中 包含 分 隔 符 怎么 办 ? 

字段 内 容 中 包含 换行 符 怎 么 办 ? 

对 于 这 些 问题 ，CSV 有 一 个 参考 标准 : RFC- 
4180 (https://tools.ietf.org/html/rfc4180 ) ， 但 实践 中 不 同 程序 往往 有 其 
他 处 理 方 式 ， 所 入 的 是 ， 处 理 方式 大 体 类 似 ， 大 概 有 以 下 两 种 处 理 方 


式 。 











1) 使 用 引用 符号 比如 "， 在 字段 内 容 两 边 加 上 "， 如 宁 内 容 中 包 


含 "本 身 ， 则 使 用 两 个 "。 
2) 使 用 转 义 字符 ， 常 用 的 是 \， 如 果 内 容 中 包含 \， 则 使 用 两 个 \。 
比如 ， 如 果 字 段 内 容 有 两 行 ， 内 容 为 : 





hello, world \ abc 





使 用 第 一 种 方式 ， 内 容 会 变 为 : 





"hello, worild \ abc 





使 用 第 二 种 方式 ， 内 容 会 变 为 : 





hello\，world AN abcxn'" 老 马 " 





CSV 还 有 其 他 一 些 细节 ， 不 同 程 序 的 处 理 方式 也 不 一 样 ， 比 如 : 





怎么 表示 null 值 
. 空 行 和 字段 之 间 的 空格 怎么 处 理 
怎么 表示 注释 


对 于 以 上 这 些 复杂 问题 ， 使 用 简单 的 字符 流 束 难以 处 理 了 。 有 一 个 
第 三 方 类 库 : Apache Commons CSV， 对 处 理 CSV 提 供 了 良好 的 支持 ， 
它 的 官网 地 址 是 http://commons.apache.org/proper/commons-csv/index.html 
。 本 节 使 用 其 1.4 版 本 ， 简 要 介绍 其 用 法 。Apache Commons CSV 中 有 一 
个 重要 的 类 CSVFormat， 它 表示 CSV 格 式 ， 它 有 很 多 方法 以 定义 具体 的 
CSV 格 式 ， 如 : 








// 定 义 分 隔 符 
public CSVFormat withDelimiter(final char delimiter) 
// 定 义 引 号 符 
public CSVFormat withQuote(final char quoteChar) 
// 定 义 转 义 符 





public CSVFormat withEScape(final char escape) 

// 定 义 值 为 nul1l 的 对 象 对 应 的 字符 串 值 

public CSVFormat withNullString(final String nullstring) 

// 定 义 记录 之 间 的 分 隔 符 

public CSVFormat withRecordSeparator(final char recordSeparator) 

// 定 义 是 否 忽略 字段 之 间 的 邱 

public CSVFormat withIgnoreSurroundingSpaces( 
final boolean ignoreSurroundingSpaces) 
































比如 ， 如 果 CSV 格 式 使 用 分 号 ; 作为 分 隔 符 ， 使 用 "作为 引号 符 ， 
使 用 N/A 表示 null 对 象 ， 忽 略 字 上 段 之 间 的 空白 ， 那 么 CSVFormat 可 以 如 下 
创建 : 





CSVFormat format = CSVFormat.newFormat(';') 
.WithQuote('"').withNullstring("N/A") 
.withIgnoreSurroundingSpaces(true); 





除了 自 定 义 CSVFormat，CSVFormat 类 中 也 定义 了 一 些 预 定义 的 格 
式 ， 如 CSVFormat.DEFAULT, CSVFormat.RFC4180。 


CSVFormat 有 一 个 方法 ， 可 以 分 析 字 符 流 : 





public CSVParser parse(final Reader in) throws IOException 











返回 值 类 型 为 CSVParser， 它 有 如 下 方法 获取 记录 信息 : 





public Iterator<CSVRecord> iterator() 
public List<CSVRecord> getRecords() throws IOException 
public long getRecordNumber () 














CSVRecord 表 示 一 条 记录 ， 它 有 如 下 方法 获取 每 个 字段 的 信息 : 








// 根 据 字 段 列 索引 获取 值 ， 索 引 从 0 开始 
public String get(final int i) 

// 根 据 列 名 获取 值 

public String get(final String name) 
// 字 段 个 数 

public int size() 

// 字 段 的 迭代 器 


public Iterator<String> iterator() 








ey| 


分 析 CSV 文 件 的 基本 代码 如 下 所 示 : 





CSVFormat format = CSVFormat.newFormat(';') 
.WithQuote('"').withNullSstring("N/A") 
.withIgnoreSurroundingSpaces(true); 

Reader reader = new FileReader("student,.csv"); 

try{ 

for(CSVRecord record : format.parse(reader))t{ 
int fieldNum = record.size(); 
for(int i=0; i<fieldNum; i++){ 
System.out.print(record.get(i)+" "); 
} 


System.out.printiln(); 


} 
}finally{ 

reader .close( ); 
} 





除了 分 析 CSV 文 件 ，Apache Commons CSV 也 可 以 写 CSV 文 件 ， 有 
一 个 CSVPrinter， 它 有 很 多 打印 方法 ， 比 如 : 











// 输 出 一 条 记录 ， 参 数 可 变 ， 每 个 参数 是 一 个 字段 值 

public void printRecord(final Object... values) throws IOException 
// 输 出 一 条 记录 

public void printRecord(final Iterable<?> values) throws IOException 











代码 示例 : 





CSVPrinter out = new CSVPrinter(new Filewriter("student.csv"), 
CSVFormat .DEFAULT); 

out .printRecord(" 老 马 "，18， "看 电影 ,看书 , 听 音 乐 "); 

out .printRecord(" 小 马 "，16， "乐高 ; 药 车 ;”) ; 

out.close( ); 
































输出 文件 student.csv 中 的 内 容 为 : 





" 老 马 " ,18, "看 电影 ,看 书 , 听 音乐 " 
"小 马 " 16, 乐高 ;赛车 ， 





14.1.3 Excel 


Excel 主 要 有 两 种 格式 ， 扩 展 名 分 别 为 .xls 和 .xlsx。 .xlsx 是 Office 


2007 以 后 的 Excel 文 件 的 默认 扩展 名 。Java 中 处 理 Excel 文 件 及 其 他 微软 
文档 广泛 使 用 POI 类 库 ， 其 官网 是 http://poi.apache.org/ 。 本 节 使 用 其 3.15 
版 本 ， 简 要 介绍 其 用 法 。 使 用 POI 处 理 Excel 文 件 ， 有 如 下 主要 类 。 


1) Workbook: 表示 一 个 Excel 文 件 对 象 ， 它 是 一 个 接口 ， 有 两 个 主 
要 类 HSSFWork-book 和 XSSFWorkbook， 前 者 对 应 .xls 格 式 ， 后 者 对 
应 .xlsx 格 式 。 

2) Sheet: 表示 一 个 工作 表 。 

3) Row: 表示 一 行 。 

4) Cell: 表示 一 个 单元 格 。 


比如 ， 保 存 学 生 列 表 到 student.xls， 代 码 可 以 为 : 





public static void saveAsExcel(List<Student> list) throws IOException { 

Workbook wb = new HSSFWorkbook(); 

Sheet sheet = wb.createSheet(); 

for(int i = 0; i < list.size(); i++) { 
Student student = list.get(i); 
Row row = sheet.createRow(i); 
row.createCcell(0).setcellValue(student.getName( ) ) ; 
row.createCell(1).setcellValue(student.getAge( )); 
row.createCell(2).setcellValue(student.getScore()); 


OutputStream out = new FileOutputStream("student.x]ls"); 
wb.write(out); 

out.close( ); 

wb.close( ); 





如 休 要 保存 为 .xlsx 格 式 ， 只 需要 痊 换 第 一 行为 : 





Workbook wb = new XSSFworkbook(); 





使 用 POI 也 可 以 方便 的 解析 Excel 文 件 ， 使 用 WorkbookFactory 的 
create 方 法 即 可 ， 如 下 所 示 : 





public static List<Student> readAsExcel() throws Exception { 
Workbook wb = WorkbookFactory.create(new File("student.xl1s")); 
List<Student> list = new ArrayList<Student>(); 
for(Sheet sheet : wb){ 


for(Row row : Sheet){ 
String name = row,getCcel1(0).getStringCelJValue(); 
int age = (int)row.getCcell(1).getNumericCellValue(); 
double Score = row,getCcel1(2).getNumerIicCelJValue( ); 
list.add(new Student(name, age, score)); 


wb.close(); 
return list,; 





以 上 只 是 介绍 了 基本 用 法 ， 如 果 需 要 更 多 信息 ， 如 配置 单元 格 的 格 
式 、 颜 色 、 字 体 ， 可 参看 http:/poi.apache.org/spreadsheetquick- 
guide.html 。 


14.1.4 HIML 


HTML 是 网 页 的 格式 ， 如 果 不 熟 悉 ， 可 以 参 
看 http://www.w3school.com.cn/html/html_intro.asp 。 在 日 常 工 作 中 ， 可 
能 需要 分 析 HITMEL 页 面 ， 抽 取 其 中 感 兴趣 的 信息 。 有 很 多 HIML 分 析 
器 ， 我 们 简要 介绍 一 种 : jsoup， 其 官网 地 址 为 https://jsoup.org/ 。 本 节 
使 用 其 1.10.2 版 本 。 我 们 通过 一 个 简单 例子 来 看 jsoup 的 使 用 ， 我 们 要 分 
析 的 网 页 地 址 是 http:/www.cnblogs.com/swiftma/p/5631311.html 。 浏 览 
器 中 看 起 来 的 样子 (部 分 截图 ) 如 图 14-1 所 示 。 
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图 14-1 HTML 网 页 示例 


将 网 页 保存 下 来 ， 其 HTML 代 码 〈 部 分 截图 ) 看 上 去 如 图 14-2 所 


<div class="blogSstats"> 


<div id="blog stats"> 
<span id="stats post count"> 随 笔 - 62&nbsp; </span> 
<span id="stats article count"> 文 章 - 0gnbsp; </span> 
<span id="stats-comment count"> 评 论 - 171</span> 
</div> 


</div><!--end: blogStats --> 
</div><!--end: navigator 博客 导航 栏 --> 
</div><!--end: header 头 部 --> 


57 口 <div id="main"> 
58 口 <div id="mainContent"> 
59 口 <div class="forFlow"> 
60 
61 <div id="post detail"> 
62 <!--done--> 
63 <div id="topics"> 
64 口 <div class="post"> 
65 晶 <hl class="postTitle"> 
<a id="cb post title url" class="postTitle2" 
href="http://www.cnblogs.com/swiftma/p/5631311.html"> 计 算 机 程序 的 思维 逻辑 - 文章 列表 
</a> 
</h1l> 
<div class="clear"></div> 
<div class="postBody"> 
<div id="cnblogs post body"><p><a id="post title link 5396551" 
href="http://www.cnblogs.com/swiftma/p/5396551.html"> 计 算 机 程序 的 思维 逻辑 (1) - 
数据 和 变量 </a></p> 
<p><a id="post title link 5399315" 
href="http://www.cnblogs.com/swiftma/p/5399315 .html"> 计 算 机 程序 的 思维 逻辑 (2) - 赋值 </a> 
</p> 
<p><a id="post title link 5405417" 
href="http://www.cnblogs.com/swiftma/p/5405417 .html"> 计 算 机 程序 的 思维 逻辑 (3) - 基本 运算 </a> 
</p> 





图 14-2 HTML 网 页 代码 示例 


假定 我 们 要 抽取 网 页 主题 内 容 中 每 篇 文章 的 标题 和 链接 ， 怎 么 实现 
呢 ? jsoup 文 持 使 用 CSS 选 择 器 语法 查找 元 系 ， 如 果 不 了 解 CSS 选 择 右 ， 


可 参看 http://www.w3school.com.cn/cssref/css_selectors.asp 。 


定位 文章 列表 的 CSS 选 择 器 可 以 是 : 





#cnblogs_post_body p a 





我 们 来 看 代码 (假定 文件 为 artidles.html)》: 





Document doc = Jsoup.parse(new File("articles.html"), "UTF-8"); 
Elements elements = doc.select("#cnblogs_ post_body p a"); 
for(Element e : elements){ 

String title = e.text(); 

String href = e.attr("href"); 

System.out.println(title+", "+href); 


输出 为 (部 分 〉: 

















计算 机 程序 的 思维 逻辑 (1) - 数据 和 变量 ，http://www.cnblogs.com/swiftma/p/5396551.html 
计算 机 程序 的 思维 逻辑 (2) - 赋值 ，http://www.cnblogs.com/swiftma/p/5399315.html 



































人 以 直接 连接 URL 进 行 分 析 ， 比 如 ， 上 面 代码 的 第 一 行 可 以 





String url = "http://www.cnblogs.com/swiftma/p/5631311.html"; 
Document doc = Jsoup.connect(url).get(); 





关于 jsoup 的 更 多 用 法 ， 请 参看 其 官网 。 
14.1.5 “压缩 文件 


压缩 文件 有 多 种 格式 ，Java SDK 支 持 两 种 :gzip 和 zip，gzip 只 能 压 
缩 一 个 文件 ， 而 zip 文 件 中 可 以 包含 多 个 文件 。 下 面 介绍 Java API 中 的 基 
本 用 法 ， 如 果 需 要 更 多 格式 ， 可 以 考虑 Apache Commons Compress， 网 


址 为 http://commons.apache.org/proper/commons-compress/ 。 


先 来 看 gzip， 有 两 个 主要 的 类 : 





java.util.zip.GZIPOUtputStream 
java.util.zip.GZIPINputStream 





它们 分 别 是 OutputStream 和 InputStream 的 子 类 ， 都 是 装饰 类 ， 
GZIPOutputStream 加 到 已 有 的 流 上 ， 束 可 以 实现 压缩 ， 而 
GZIPInputStream 加 到 已 有 的 流 上 ， 束 可 以 实现 解压 缩 。 比 如 ， 压 缩 一 个 
文件 的 代码 可 以 为 : 





public static void gzip(String fileName) throws IOEXception { 
InputStream in = null; 
String gzipFileName = fileName + ".gz"; 
OutputStream out = null; 
try { 
in = new BufferedInputStream(new FileInputStream(fileName)); 
out = new GZIPOutputStream(new BufferedoutputStream( 
new FileOutputStream(gzipFileName))); 


copy(in, out); 
} finally { 
if(out != null) { 
out.close(); 


} 

if(in != null) { 
in.close(); 

} 





调用 的 copy 方 法 是 我 们 在 上 一 章 介 绍 的 。 解 压缩 文件 的 代码 可 以 





public static void gunzip(String gzipFileName, String unzipFileName) 
throws IOException { 
InputStream in = null; 
OutputStream out = null; 
try { 
in = new GZIPInputStream(new BufferedInputStream( 
new FileInputStream(gzipFileNanme))); 
out = new BufferedoutputStream(new FileOutputStream( 
unzipFileName)); 
copy(in, out); 
} finally { 
if(out != nul1) { 
out.close(); 


} 

if(in != null) { 
in.close( ); 

} 





zip 文 件 文 持 一 个 压缩 文件 中 包含 多 个 文件 ，Java API 中 主要 的 类 


日 
XE : 





java.util.zip.ZipOutputStream 
java.util.zip.ZipInputStream 





它们 也 分 别 是 OutputStream 和 InputStream 的 子 类 ， 也 都 是 装饰 类 ， 
但 不 能 像 GZIP-OutputStream/GZIPInputStream 那 样 简单 使 用 。 


ZipOutputStream 可 以 写 入 多 个 文件 ， 它 有 一 个 重要 方法 : 





public void putNextEntry(ZipEntry e) throws IOException 





在 写 入 每 一 个 文件 前 ， 必 须要 先 调 用 该 方法 ， 表 示 准 备 写 入 一 个 压 
缩 条 目 ZipEntry， 每 个 压缩 条 目 有 个 名 称 ， 这 个 名 称 古 压缩 文件 的 相对 
路 径 ， 如 果 名 称 以 字符 结尾， 表示 目录 ， 它 的 构造 方法 是 : 











public ZipEntry(String name) 





我 们 看 一 段 代 码 ， 压 缩 一 个 文件 或 一 个 目录 : 





public static void zip(File inFile, File zipFile) throws IOException { 
ZipoutputStream out = new ZipOutputStream(new BufferedoutputStream( 
new FileOutputSstream(zipFile))); 
try { 
if(!inFile.exists()) { 
throw new FileNotFoundException(inFile.getAbsolutePath()); 
} 


inFile = inFile.getCanonicalrile(); 

String rootPath = inFile.getParent(); 

if(!rootPpath.endswith(File.separator)) { 
rootPath += File.separator,; 


addFileToZipOut(inFile, out, rootPath); 
} finally { 

out.close( ); 
} 





参数 inFile 表 示 输 入 ， 可 以 是 普通 文件 或 目录 ，zipFile 表 示 输 出 ， 
rootPath 表 示 父 目录 ， 用 于 计算 每 个 文件 的 相对 路 径 ， 主 要 调用 了 
addFileToZipOut 将 文件 加 入 到 ZipOutput-Stream 中 ， 代 码 为 : 





private static void addFileToZipOut(File file, ZipOutputStream out, 
String rootPath) throws IOException { 
String relativePath = file.getCcanonicalPath().substring( 
rootPath.1length()); 
if(file.isFile()) { 
out.putNextEntry(new ZipEntry(relativePath)); 
InputStream in = new BufferedInputStream(new FileInputStream(file)); 
try { 
copy(in, out); 
} finally { 
in.close( ); 


} 
} else { 
out.putNextEntry(new ZipEntry(relativePath + File.separator)); 
for(File f : file.listFiles()) { 
addFileToZipOut(f, out, rootPath); 


} 





它 同样 调用 了 copy 方 法 将 文件 内 容 写 入 ZipOutputStream， 对 于 目 
录 ， 进 行 了 递归 调 用 。 


ZipInputStream 用 于 解压 zip 文 件 ， 它 有 一 个 对 应 的 方法 ， 获 取 压 缩 
we 
才 \ 目 : 











public ZipEntry getNextEntry() throws IOException 





如 果 返 回 值 为 nmull， 表 示 没 有 条 目 了 。 使 用 ZipInputStream 解 压 文 
件 ， 可 以 使 用 类 似 如 下 代码 : 





public static void unzip(File zipFile, String destDir) throws IOException { 
ZipInputStream zin = new ZipInputStream(new BufferedInputStream( 
new FileInputStream(zipFile))); 
if(!destDir.endswith(File.separator)) { 
destDir += File.separator; 


} 
try { 
ZipEntry entry = zin.getNextEntry(); 
while(entry != null) { 
extractZipEntry(entry, zin, destDir); 
entry = zin.getNextEntry(); 


} 
} finally { 
zin.close( ); 
} 








调用 extractZipEntry 处 理 每 个 压缩 条 目 ， 代 码 为 : 





private static void extractZipEntry(ZipEntry entry，ZipInputStream zin, 
String destDir) throws IOException { 
if(!entry.isDirectory()) { 
File parent = new File(destDir + entry.getName()).getPparentFile(); 
if(!parent.exists()) { 
parent.mkdirs(); 


} 
OutputStream entryout = new BufferedoutputStream( 
new FileOutputStream(destDir + entry.getName())); 
try { 
copy(zin, entryOut); 
} finally { 
entryOut.close(); 


} 
} else { 

new File(destDir + entry.getName()).mkdirs(); 
} 





至 此 ， 关 于 5 种 常见 文件 类 型 的 处 理 : 属性 文件 、CSV、Excel、 
HTML 和 压缩 文件 ， 就 介绍 完了 。 完 整 的 代码 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma .file.c64 
hs 


14.2 ”随机 读 写 文件 


我 们 先 介 绍 RandomAccessFile 的 用 法 ， 然 后 介绍 怎么 利用 它 实现 一 
个 简单 的 键 值 对 数据 库 。 


14.2.1 用 法 


RandomAccessFile 有 如 下 构造 方法 : 





public RandomAccessFile(String name, String mode ) 
throws FileNotFoundException 

public RandomAccessFile(File file, String mode) 
throws FileNotFoundException 





参数 name 和 file 容 易 理 解 ， 表 示 文 件 路 径 和 File 对 象 ，mode 是 什么 
意思 呢 ? 它 表 示 打 开 模 式 ， 可 以 有 4 个 取 值 。 


1) "r": 只 用 于 读 。 
2) "rw": 用 于 读 和 写 。 


3) "rws": 和 "rw" 一 样 ， 用 于 读 和 写 ， 另 外 ， 它 要 求 文件 内 容 和 元 
数据 的 任何 更 新 都 同步 到 设备 上 。 


4) "rwd": 和 "rw" 一 样 ， 用 于 读 和 写 ， 另 外 ， 它 要 求 文 件 内 容 的 任 
何 更 新 都 同步 到 设备 上 ， 和 "rws" 的 区 别 是 ， 元 数据 的 更 新 不 要 求 同 


步 。 








RandomAccessFile 虽 然 不 是 InputStream/OutputStream 的 子 类 ， 但 它 
也 有 类 似 于 读 写 字 节 流 的 方法 。 男 外 ， 它 还 实现 了 DataInput/DataOutput 
接口 。 这 些 方 法 我 们 之 前 基本 都 介绍 过 ， 这 里 列举 部 分 方法 ， 以 增强 直 
观感 受 : 








// 读 一 个 字 节 ， 取 最 低 8 位 ，0 一 255 
public int read() throws IOException 
public int read(byte b[]) throws IOException 


public final int readInt() throws IOException 
public final void writeInt(int v) throws IOException 
public void write(byte b[]) throws IOException 





RandomAccessFile 还 有 男 外 两 个 read 方 法 : 





public final void readFully(byte b[]) throws IOException 
public final void readFully(byte b[], int off, int len) throws IOException 





与 对 应 的 read 方 法 的 区 别 是 ， 它 们 可 以 确保 读 够 期 望 的 长 度 ， 如 果 
到 了 文件 结尾 也 没 读 够 ， 它 们 会 抛 出 EOFException 异 常 。 


RandomAccessFile 内 部 有 一 个 文件 指针 ， 指 辣 当 前 读 写 的 位 置 ， 各 
种 read/write 操 作 都 会 自动 更 新 该 指针 。 与 流 不 同 的 是 ， 
RandomAccessFile 可 以 获取 该 指针 ， 也 可 以 更 改 该 指针 ， 相 关 方 法 是 : 








// 获 取 当 前 文件 指针 
public native long getFilePointer() throws IOException 
// 更 改 当 前 文件 指针 到 pos 


public native void seek(long pos) throws IOException 





ds 








RandomAccessFile 是 通过 本 地 方法 ， 最 终 调用 操作 系统 的 API 来 实 
现 文件 指针 调整 的 。 


InputStream 有 一 个 Skip 方法， 可 以 跳 过 输入 流 中 n 个 字 节 ， 默 认 情 况 
下 ， 它 是 通过 实际 读 取 n 个 字 节 实现 的 。RandomAccessFile 有 一 个 类 似 
方法 ， 不 过 它 是 通过 更 改 文件 指针 实现 的 : 








public int skipBytes(int n) throws IOException 








RandomAccessFile 可 以 直接 获取 文件 长 度 ， 返 回 文件 字 节 数 ， 方 法 
为 : 





public native long length() throws IOException 








它 还 可 以 直接 修改 文件 长 度 ， 方 法 为 : 





public native void setLength(long newLength) throws IOException 








如 果 当 前 文件 的 长 度 小 于 newLength， 则 文件 会 扩展 ， 扩 展 部 分 的 
内 容 未 定义 。 如 条 当前 文件 的 长 度 大 于 newLength， 则 文件 会 收缩 ， 多 
出 的 部 分 会 截取 ， 如 有 果 当 前 文件 指针 比 newLength 大 ， 则 调用 后 会 变 为 


newLength 。 





RandomAccessFile 中 有 如 下 方法 ， 需 要 注意 一 下 : 





public final void writeBytes(String s) throws IOException 
public final String readLine() throws IOException 





看 上 去 ，writeBytes 方 法 可 以 直接 写 入 字符 串 ， 而 readLine 方 法 可 以 
按 行 读 入 字符 串 ， 实 际 上 ， 这 两 个 方法 都 是 有 问题 的 ， 它 们 都 没有 编码 
的 概念 ， 都 假定 一 个 字 节 就 代表 一 个 字符 ， 这 对 于 中 文 显然 是 不 成 立 
的 ， 所 以 ， 应 避免 使 用 这 两 个 方法 。 





14.2.2 ”设计 一 个 键 值 数据 库 BasicDB 


在 日 常 的 一 般 文件 读 写 中 ， 使 用 流 就 可 以 了 ， 但 在 一 些 系统 程序 
中 ， 20 RandomAccessFile 因 为 更 接近 操作 系统 ， 更 为 方便 
和 高 效 。 


下 面 ， 我 们 来 看 怎么 利用 RandomAccessFile 实 现 一 个 简单 的 键 值 数 
据 库 ， 我 们 称 之 为 BasicDB。 我 们 从 功能 、 接 口 、 使 用 和 设计 等 几 个 方 
面 进 行 介 绍 ， 完 整 的 代码 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma.file.c60 


1. 功 能 


BasicDB 提 供 的 接口 类 似 于 Map 接 口 ， 可 以 按键 保存 、 查 找 、 删 
除 ， 但 数据 可 以 持久 化 保存 到 文件 上 。 此 外 ， 不 像 HashMap/TreeMap， 
它们 将 所 有 数据 保存 在 内 存 ，BasicDB 只 把 元 数据 如 索引 信息 保存 在 内 
存 ， 值 的 数据 保存 在 文件 上 。 相 比 HashMap/TreeMap，BasicDB 的 内 存 
消耗 可 以 大 大 降低 ， 存 储 的 键 值 对 个 数 大 大 提高 ， 尤 其 当 值 数 据 比 较 大 








的 时 候 。BasicDB 通 过 索引 ， 以 及 RandomAccessFile 的 随机 读 写 功能 保 
证 效率 。 


2. 接 口 


对 外 ，BasicDB 提 供 的 构造 方法 是 : 





public BasicDB(String path, String name) throws IOException 





path 表 示 数 据 库 文件 所 在 的 目录 ， 该 目录 必须 已 存在 。name 表 示 数 
据 库 的 名 称 ，BasicDB 会 使 用 以 name 开 头 的 两 个 文件 ， 一 个 存储 元 数 
据 ， 扩 展 名 是 .meta， 一 个 存储 键 值 对 中 的 值 数 据 ， 扩 展 名 是 .data。 比 
如 ， 如 果 name 为 student， 则 两 个 文件 为 student.meta 和 student.data， 这 两 
个 文件 不 一 定 存 在 ， 如 果 不 存 在 ， 则 创建 新 的 数据 库 ， 如 果 已 存在 ， 则 
加 载 已 有 的 数据 库 。 


BasicDB 提 供 的 公开 方法 有 : 











// 保 存 键 值 对 ， 键 为 String 类 型 ， 值 为 byte 数 组 
public void put(String key，byte[] value) throws IOException 
// 根 据 键 获取 值 ， 如 果 键 不 存在 ， 返 回 nu11 

public byte[] get(String key) throws IOException 

public void remove(String key) // 根 据 键 删除 

public void flush() throws IOException // 确 保 将 所 有 数据 保存 到 文件 
public void close() throws IOException // 关 闭 数 据 库 





























为 便于 实现 ， 我 们 假定 值 即 byte 数 组 的 长 度 不 超过 1020， 如 果 超 
过 ， 会 抛 出 异 弟 ， 当 然 ， 这 个 长 度 在 代码 中 可 以 调整 。 在 调用 put 和 
remove 后 ， 修 改 不 会 马上 反映 到 文件 中 ， 如 果 需 要 确保 保存 到 文件 中 ， 
需要 调用 flush。 


3. 使 用 

在 BasicDB 中 ， 我 们 设计 的 值 为 byte 数 组 ， 这 看 上 去 是 一 个 限制 ， 
不 便 使 用 ， 我 们 主要 是 为 了 简化 ， 而 且 任 何 数据 都 可 以 转化 为 byte 数 组 
保存 。 对 于 字符 串 ， 可 以 使 用 getBytes () 方法 ， 对 于 对 象 ， 可 以 使 用 
之 前 介绍 的 流转 换 为 byte 数 组 。 


比如 ， 保 存 一 些 学 生 信息 到 数据 库 ， 代 码 可 以 为 : 
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private static byte[] toBytes(Student student) throws IOException { 
ByteArrayOutputStream bout = new ByteArrayOutputStream( ); 
DataOutputStream dout = new DataOutputStream(bout); 
dout .writeUTF(student .getName( )); 
dout .writeInt(student.getAge( )); 
dout .writeDouble(student.getScore()); 
return bout ,toByteArray() ， 


public static void saveStudents(Map<String, Student> students ) 
throws IOException 区 
BasicDB db = new BasicDB("./", "students"); 
for(Map.Entry<String, Student> kv : Students,entrySet()) { 
db.put(kv.getKkey(), toBytes(kv.getValue())); 


} 
db.close( ); 
} 








保存 学 生 信息 到 当前 目录 下 的 students 数 据 库 ，toBytes 方 法 将 
Student 转 换 为 了 字 节 。14.3 节 会 介绍 序列 化 ， 使 用 序列 化 ，toBytes 方 法 
的 代码 可 以 更 为 简洁 。 


4. 设 计 

我 们 采用 如 下 简单 的 设计 。 

1) 将 键 值 对 分 为 两 部 分 ， 值 保存 在 单独 的 .data 文 件 中 ， 值 在 .data 
文件 中 的 位 置 和 键 称 为 索引 ， 索 引 保存 在 .meta 文 件 中 。 


2) 在 .data 文 件 中 ， 每 个 值 占用 的 空间 固定 ， 固 定 长 度 为 1024， 前 4 
个 字 节 表示 实际 长 度 ， 然 后 是 实际 内 容 ， 实 际 长 度 不 够 1020 的 ， 后 面 是 
补 白 字 节 0。 


3) 索引 信息 既 保 存在 .meta 文 件 中 ， 也 保存 在 内 存 中 ， 在 初始 化 
ee 
新 。 


4) 删除 键 值 对 不 修改 .data 文 件 ， 但 会 从 索引 中 删除 并 记录 空白 空 
间 ， 下 次 添加 键 值 对 的 时 候 会 重用 空白 空间 ， 所 有 的 空白 空间 也 记录 
到 .meta 文 件 中 。 


我 们 和 暂 不 考 夸 由 于 并 发 访问 、 腊 间 关 闭 等 引起 的 一 致 性 问题 。 这 个 
设计 虽然 是 比较 粗糙 的 ， 但 可 以 演示 一 些 基 本 概念 。 























14.2.3 ”BasicDB 的 实现 


下 和 面 ， 我 们 来 看 实现 代码 ， 先 来 看 内 部 组 成 和 构造 方法 ， 然 后 看 一 
些 主要 方法 的 实现 。 


BasicDB 定 义 了 如 下 静态 变量 : 








private static final int MAX_DATA LENGTH = 1020; 
// 补 白字 节 
private static final byte[] ZERO_BYTES = new byte[MAX_ DATA_ LENGTH]; 

















// 数 据 文件 扩展 名 

private static final String DATA_SUFFIX = ".data"; 
// 元 数据 文件 扩展 名 ， 包 括 索 引 和 空白 空间 数据 

private static final String META SUFFIX = ".meta",; 








内 存 中 表示 索引 和 空白 空间 的 数据 结构 是 : 











Map<String，Long> indexMap; // 索 引信 息 ， 键 -> 值 在 .data 文 件 中 的 位 置 
Queue<Long> gaps; // 空 白 空间 ， 值 为 在 . data 文件 中 的 位 置 





















































表示 文件 的 数据 结构 是 : 








RandomAccessFile db; // 值 数据 文件 
File metaFile; // 元 数据 文件 





构造 方法 的 代码 为 : 





public BasicDB(String path，String name) throws IOExceptionf{ 

File dataFile = new File(path + name + DATA_ SUFFIX); 
metaFile = new File(path + name + META SUFFIX); 
db = new RandomAccessFile(dataFile, "rw"); 
if(metaFile.exists())t{ 

loadMeta( ) ; 
}elsef{ 

indexMap = new HashMap<>(); 

gaps = new ArrayDeque<>(); 





元 数据 文件 存在 时 ， 会 调用 loadMeta 将 元 数据 加 载 到 内 存 ， 我 们 先 
假定 不 存在 ， 先 来 看 其 他 代码 。 保 存 键 值 对 的 方法 是 put， 其 代码 为 : 
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public void put(String key，byte[] value) throws IOException{ 
Long index = indexMap.get(key); 
if(index==null){ 
index = nextAvailablePos(); 
indexMap.put(key, index); 


writeData(index, value); 


} 





先 通过 索引 查找 键 是 否 存 在 ， 如 果 不 存在 ， 调 用 nextAvailablePos 方 
法 为 值 找 一 个 存储 位 置 ， 并 将 键 和 存储 位 置 保存 到 索引 中 ， 最 后 ， 调 用 
writeData 方 法 将 值 写 到 数据 文件 中 。 


nextAvailablePos 的 代码 是 : 





private long nextAvailablePos() throws IOException{ 
if(!gaps.isEmpty())t{ 
return gaps.poll(); 
}elsef{ 
return db.1length(); 








它 首 移 得 找 空白 空间 ， 如 果 有 ， 则 重用 ， 人 否则 定位 到 文件 末尾 。 
writeData 方 法 实际 写 值 数据 ， 它 的 代码 是 : 








private void writeData(long pos，byte[] data) throws IOException { 
if(data.length > MAX_DATA LENGTH) { 
throw new IllegalArgumentException("maximum allowed length is " 
+ MAX_DATA_LENGTH + ", data length is " + data.length); 


} 

db,.seek(pos); 

db .writeInt(data.1length); 

db .write(data); 

db .write(ZERO_BYTES, 0, MAX_DATA _LENGTH - data.length); 





它 先 检查 长 度 ， 长 度 满足 的 情况 下 ， 定 位 到 指定 位 置 ， 写 实际 数据 
的 长 度 、 写 内 容 、 最 后 补 白 。 


可 以 看 出 ， 在 这 个 实现 中 ， 索引 信息 和 空白 空间 信息 并 没有 实时 保 
存 到 文件 中 ， 要 保存 ， 需 要 调用 flush 方 法 ， 待 会 我 们 再 看 这 个 方法 。 














根据 键 获取 值 的 方法 是 get， 其 代码 为 : 





public byte[] get(String key) throws IOEXxceptiont{f 
Long index = indexMap.get(key); 
If(index!=nulJl){ 
return getData(index); 


return null; 





» 
NA 


如 果 键 存在 ， 就 调用 getData 方 法 获取 数据 。getData 方 法 的 代码 





private byte[] getData(long pos) throws IOException{ 
db.seek(pos); 
int length = db.readIint(); 
byte[] data = new byte[length]; 
db.readFully(data); 
return data,; 





代码 也 很 简单 ， 定 位 到 指定 位 置 ， 读 取 实 际 长 度 ， 然 后 调用 
readFully 方 法 读 够 内 容 。 


删除 键 值 对 的 方法 是 remove， 其 代码 为 : 








public void remove(String key)t{ 
Long index = indexMap.remove(key); 
if(index!=null)t{ 
gaps.offer(index); 





从 索引 结构 中 删除 ， 并 添加 到 空白 空间 队列 中 。 
同步 元 数据 的 方法 是 flush〈() ， 其 代码 为 : 





public void flush() throws IOException{ 
saveMeta( ); 
db.getFD().sync(); 

} 





回顾 一 下 ，getFD 方 法 会 返回 文件 描述 符 ， 其 sync 方 法 会 确保 文件 
内 容 保存 到 设备 上 ，saveMeta 方 法 的 代码 为 : 





private void saveMeta() throws IOException{ 
DataOutputStream out = new Data0utputStream( 
new BufferedoutputStream(new FileOutputStream(metaFile))); 

try{ 

SaveIndex(out ) ; 

SaveGaps(out ) ， 
}finally{ 

out.close( ); 
} 





索引 信息 和 空白 空间 保存 在 一 个 文件 中 ，saveIndex 保 存 索 引信 息 ， 
代码 为 : 





private void saveIndex(DataOutputStream out) throws IOException{ 
out .writeInt(indexMap.size()); 
for(Map.Entry<String, Long> entry : indexMap.entrySet()){ 
out .writeUTF(entry.getkey()); 
out .writeLong(entry.getValue()); 
} 








先 保存 键 值 对 个 数 ， 然 后 针对 每 条 索引 信息 ， 保 存 键 及 值 在 .data 文 
件 中 的 位 置 。 


SaveGaps 方 法 保存 空白 空间 信息 ， 代 码 为 : 





private void saveGaps(Data0utputStream out) throws IOException{ 
out .writeInt(gaps.size()); 
for(Long pos : gaps){ 
out .writeLong(pos); 
} 


} 








也 是 先 保 存 长 度 ， 然 后 保存 每 条 空白 空间 信息 。 


我 们 使 用 了 之 前 介绍 的 流 来 保存 ， 这 些 代 码 比 较 烦 琐 ， 如 果 使 用 后 
续 介 绍 的 序列 化 ， 代码 会 更 为 简洁 。 


在 构造 方法 中 ， 我 们 提 到 了 1loadMeta 方 法 ， 它 是 saveMeta 的 逆 操 





作 ， 代 码 为 : 





private void loadMeta() throws IOException{ 
DataInputStream in = new DataInputStream( 
new BufferedInputStream(new FileInputStream(metaFile))); 

try{ 

loadIndex(in); 

loadGaps(in); 
}finally{ 

in.close( ); 
} 





loadIndex 加 载 索 引 ， 代 码 为 : 





private void loadIndex(DataInputStream in) throws IOException{ 
int size = in,.readIint(); 
indexMap = new HashMap<String, Long>((int) (size / 0.75f) + 1, 0.75f); 
for(int i=0; i<size; i++){ 
String key = in.readUTF(); 
long index = in.readLong(); 
indexMap.put(key, index); 





loadGaps 加 载 空 白 空 间 ， 代 码 为 : 





private void loadGaps(DataInputStream in) throws IOException{ 
int Size = in,.readIint(); 
gaps = new ArrayDeque<>(size); 
for(int i=0; i<size; i++){ 
long index = in.readLong(); 
gaps.add(index); 





数据 库 关 闭 的 代码 为 : 





public void close() throws IOException{ 
flush(); 
db .close( ); 





就 是 同步 数据 ， 并 关闭 数据 文件 。 
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本 节 介 绍 了 RandomAccessFile 的 用 法 ， 它 可 以 随机 读 写 ， 更 为 接近 
操作 系统 的 API， 在 实现 一 些 系统 程序 时 ， 它 比 流 要 更 为 方便 高 效 。 利 
用 RandomAccessFile， 我 们 实现 了 一 个 非常 简单 的 键 值 对 数据 库 ， 我 们 
演示 了 这 个 数据 库 的 用 法 、 接 口 、 设 计 和 实现 代码 。 在 这 个 例子 中 ， 我 
们 同时 展示 了 之 前 介绍 的 容器 和 流 的 一 些 用 法 。 


这 个 数据 库 虽 然 简 单 粗 糙 ， 但 也 具备 了 一 些 优 恨 特点 ， 比 如 占用 的 
内 存 空间 比较 小 ， 可 以 存储 大 量 键 值 对 ， 可 以 根据 键 高 效 访问 值 等 。 





14.3 ”内 存 映射 文件 


本 节 介 绍 内 存 映射 文 件 ， 内 存 映 射 文件 不 是 Java 引 入 的 概念 ， 而 古 
操作 系统 提供 的 一 种 功能 ， 大 部 分 操作 系统 都 文 持 。 我 们 移 来 介绍 内 存 
映射 文件 的 基本 概念 ， 它 是 什么 ， 能 解决 什么 问题 ， 然 后 介绍 如 何在 
Java 中 使 用 。 我 们 会 设计 和 实现 一 个 简单 的 、 持 久 化 的 、 跨 程序 的 消 筷 
队列 来 演示 内 存 映射 文件 的 应 用 。 


14.3.1 基本 概念 


所 谓 内 存 映 射 文件 ， 就 是 将 文件 映射 到 内 存 ， 文 件 对 应 于 内 存 中 的 
一 个 字 节 数组 ， 对 文件 的 操作 变 为 对 这 个 字 节 数组 的 操作 ， 而 字 市 数组 
的 操作 直接 映射 到 文件 上 。 这 种 映射 可 以 是 映射 文件 全 部 区 域 ， 也 可 以 
是 只 映 映 一 部 分 区 域 。 


不 过 ， 这 种 映射 是 操作 系统 提供 的 一 种 假象 ， 文 件 一 般 不 会 马上 加 
载 到 内 存 ， 操 作 系统 只 是 记录 下 了 这 回 事 ， 当 实际 发 生 读 写 时 ， 才 会 按 
需 加 载 。 操 作 系 统一 般 是 按 页 加 载 的 ， 页 可 以 理解 为 束 是 一 块 ， 页 的 大 
小 与 操作 系统 和 硬件 相关 ， 典 型 的 配置 可 能 是 4K、8K 等 ， 当 操作 系统 
发 现 读 写 区 域 不 在 内 存 时 ， 就 会 加 载 该 区 域 对 应 的 一 个 页 到 内 存 。 


这 种 按 需 加 载 的 方式 ， 使 得 内 存 映射 文件 可 以 方便 高 效 地 处 理 非常 
大 的 文件 ， 内 存放 不 下 整个 文件 也 不 要 紧 ， 操 作 系 统 会 自动 进行 处 
ee 
子 释放 。 


在 应 用 程序 写 的 时 候 ， 它 写 的 是 内 存 中 的 字 贡 数组， 这 个 内 容 什么 
时 候 同 步 到 文件 上 呢 ? 这 个 时 机 是 不 确定 的 ， 由 操作 系统 决定 ， 不 过 ， 
只 要 操作 系统 不 朋 沉 ,操作 系统 会 保证 同步 到 文件 上 ， 即 使 映射 这 个 文 
件 的 应 用 程序 已 经 退出 了 。 


在 一 般 的 文件 读 写 中 ， 会 有 两 次 数据 复制 ， 一 次 是 从 硬盘 复制 到 操 
作 系 统 内 核 ， 男 一 次 是 从 操作 系统 内 核 复 制 到 用 户 态 的 应 用 程序 。 而 在 
内 存 映 射 文件 中 ， 一 般 情况 下 ， 只 有 一 次 复制 ， 且 内 存 分 配 在 操作 系统 
内 核 ， 应 用 程序 访问 的 就 是 操作 系统 的 内 核 内 存 空间 ， 这 显然 要 比 普通 























的 读 写 效率 更 高 。 


内 存 映射 文件 的 另 一 个 重要 特点 是 : 它 可 以 被 多 个 不 同 的 应 用 程序 
共享 ， 多 个 程序 可 以 映射 同一 个 文件 ， 映 射 到 同一 块 内 存 区 域 ， 一 个 程 
序 对 内 存 的 修改 ， 可 以 让 其 他 程序 也 看 到 ， 这 使 得 它 特别 适合 用 于 不 同 
应 用 程序 之 间 的 通信 。 


” 0 
， 0D: 


- 按 需 加 载 代 码 ， 只 有 当前 运行 的 代码 在 内 存 ， 其 他 和 暂时 用 不 到 的 
代码 还 在 硬盘 。 


:同时 局 动 多 次 同一 个 可 执行 文件 ， 文 件 代 码 在 内 存 也 只 有 一 份 。 
不同 应 用 程序 共享 的 动态 链接 库 代 码 在 内 存 也 只 有 一 份 。 


内 存 映 射 文件 也 有 局 限 性 。 比 如 ， 它 不 太 适 合 处 理 小 文件 ， 它 是 按 
页 分 配 内 存 的 ， 对 于 小 文件 ， 会 浪费 空间 ; 男 外 ， 映 射 文件 要 消耗 一 定 
的 操作 系统 资源 ， 初 始 化 比较 慢 。 


简单 总 结 下 ， 对 于 一 般 的 文件 读 写 不 需要 使 用 内 存 映 射 文件 ， 但 如 
果 处 理 的 是 大 文件 ， 要 求 极 高 的 该 写 效率 ， 比 如 数据 库 系统 ， 或 者 需要 
在 不 同 程序 间 进 行 共 剖 和 通信 ， 那 融 可 以 考 夸 内 存 映射 文 件 。 理 解 了 内 
存 映 射 文件 的 基本 概念 ， 接 下 来 ， 我 们 看 怎么 在 Java 中 使 用 它 。 











14.3.2 用 法 


内 存 映 射 文件 需要 通过 FileInputStream/FileOutputStream 或 
RandomAccessFile， 它 们 都 有 一 个 方法 : 





public FileChannel getChannel() 


FileChannel/ 有 如 下 方法 : 


public MappedByteBuffer map(MapMode mode, long position, 
long size) throws IOException 





map 方 法 将 当前 文件 映射 到 内 存 ， 上 映射 的 结 采 束 是 一 个 
MappedByteBuffer 对 象 ， 它 代表 内 存 中 的 字数 组 ， 待 会 我 们 再 来 详细 
看 它 。map 有 三 个 参数 ，mode 表 示 映 射 模 式 ，positon 表 示 有 映射 的 起 始 位 
置 ，size 表 示 长 度 。mode 有 三 个 取 值 : 


.MapMode.READ_ONLY: 只 读 。 
.MapMode.READ_WRITE: 既 读 也 写 。 


-MapMode.PRIVATE: 私有 模式 ， 更 改 不 反映 到 文件 ， 也 不 被 其 他 
程序 看 到 。 


这 个 模式 受 限 于 背后 的 流 或 RandomAccessFile， 比 如 ， 对 于 
FileInputStream， 或 者 RandomAccessFile 但 打开 模式 是 "r"，mode 就 不 能 
设 为 MapMode.READ_WRITE， 盏 则 会 抛 出 异常 。 如 果 映 射 的 区 域 超过 
了 现 有 文件 的 范围 ， 则 文件 会 自动 扩展 ， 扩 展 出 的 区 域 字 节 内 容 为 0。 
映射 完成 后 ， 文 件 束 可 以 关闭 了 ， 后 续 对 文件 的 读 写 可 以 通过 Mapped- 
ByteBuffer。 看 段 代 人 码 ， 比 如 以 读 写 模式 映射 文件 "abc.dat"， 代 码 可 以 


~\|e。 
. 














RandomAccessFile file = new RandomAccessFile("abc.dat", "rw"); 
try { 
MappedByteBuffer buf = file.getCchannel() 
.map(MapMode .READ WRITE, 0, file.length()); 
// 使 用 buf... 
} catch (IOException e) { 
e.printStackTrace( ); 
}finally{ 
file.close( ); 
} 


























怎么 来 使 用 MappedByteBuffer 呢 ? 它 是 ByteBuffer 的 子 类 ， 而 
ByteBuffer 是 Buffer 的 子 类 。ByteBuffer 和 Buffer 不 只 是 给 内 存 映 射 文件 
提供 的 ， 它 们 是 Java NIO 中 操作 数据 的 一 种 方式 ， 用 于 很 多 地 方 ， 方 法 
也 比较 多 ， 我 们 只 介绍 一 些 主要 相关 的 。 


ByteBuffer 可 以 简单 理解 为 封装 了 一 个 字 节 数组 ， 这 个 字 节 数组 的 
长 度 是 不 可 变 的 ， 在 内 存 映 射 文件 中 ， 这 个 长 度 由 map 方 法 中 的 参数 
Size 决定 。ByteBuffer 有 一 个 基本 属性 position， 表 示 当 前 读 写 位 置 ， 这 





个 位 置 可 以 改变 ， 相 关 方 法 是 : 





public final int position() // 获 取 当 前 读 写 位 置 
public final Buffer position(int newPosition) // 修 改 当前 读 写 位 置 





ByteBuffer 中 有 很 多 基于 当前 位 置 读 写 数据 的 方法 ， 部 分 方法 如 











public abstract byte get() // 从 当前 位 置 获 取 一 个 字 节 
public ByteBuffer get(byte[] dst) // 从 当前 位 置 复 制 dst .1length 长 度 的 字 节 到 dst 
public abstract int getInt() // 从 当前 位 置 读 取 一 个 int 

public final ByteBuffer put(byte[] src) // 将 字 节 数组 src 写 入 当前 位 置 

public abstract ByteBuffer putLong(long value); // 将 value 写 入 当前 位 置 








这 些 方法 在 读 写 后 ， 都 会 自动 增加 position。 与 这 些 方法 相对 应 
的 ， 还 有 一 组 方法 ， 可 以 在 参数 中 直接 指定 position， 比 如 : 





public abstract int getInt(int index) // 从 index 处 读 取 一 个 int 

public abstract double getDouble(int index) // 从 index 处 读 取 一 个 double 
// 在 ijndex 处 写 入 一 个 double 

public abstract ByteBuffer putDouble(int index, double value) 

// 在 index 处 写 入 一 个 long 

public abstract ByteBuffer putLong(int index, long value) 











这 些 方 法 在 读 写 时 ， 不 会 改变 当前 读 写 位 置 position。 


MappedByteBuffer 自 己 还 定义 了 一 些 方法 : 











// 检 查 文件 内 容 是 否 真 实 加 载 到 了 内 存 ， 这 个 值 是 一 个 参考 值 ， 不 一 定 精确 
public final boolean isLoaded() 

public final MappedByteBuffer load() // 尽 量 将 文件 内 容 加 载 到 内 存 
public final MappedByteBuffer force() // 将 对 内 存 的 修改 强制 同步 到 硬盘 上 






































14.3.3 ”设计 一 个 消息 队列 BasicQueue 


了 解 了 内 存 映射 文件 的 用 法 ， 接 下 来 ， 我 们 来 看 怎么 用 它 设计 和 实 
现 一 个 简单 的 消息 队列 ， 我 们 称 之 为 BasicQueue。 本 小 节 先 介绍 它 的 功 
能 、 用 法 和 设计 ， 下 小 市 介绍 它 的 具体 代码 。 完 整 的 代码 在 github 上 ， 


地 址 为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.file.c61 下 。 


1. 功 能 


BasicQueue 是 一 个 先进 先 出 的 循环 队列 ， 长 度 固 定 ， 接 口 主要 是 出 
队 和 入 队 ， 与 之 前 介绍 的 容器 类 的 区 别 是 : 


1) 消 姑 持久 化 保存 在 文件 中 ， 重 局 程序 消息 不 会 丢失。 

2) 可 以 供 不 同 的 程序 进行 协作 。 典 型 场景 是 ， 有 两 个 不 同 的 程 
序 ， 一 个 是 生产 者 ， 力 一 个 是 消费 者 ， 生 成 者 只 将 消息 放 入 队列 ， 而 消 
费 者 只 从 队列 中 取消 轧 ， 两 个 程序 通过 队列 进行 协作 。 这 种 协作 方式 更 
灵活 ， 相 互 依赖 性 小 ， 是 一 种 常见 的 协作 方式 。 


BasicQueue 的 构造 方法 是 : 














public BasicQueue(String path, String queueName) throws IOException 


path 表 示 队 列 所 在 的 目录 ， 必 须 已 存在 ; queueName 表 示 队 列 名 ， 
BasicQueue 会 使 用 以 queueName 开 头 的 两 个 文件 来 保存 队列 信息 ， 一 个 
扩展 名 是 .data， 保 存 实 际 的 消息 ， 另 一 个 扩展 名 是 .meta， 保 存 元 数据 信 
恩 ， 如 果 这 两 个 文件 存在 ， 则 会 使 用 已 有 的 队列 ， 否 则 会 建立 新 队列 。 


BasicQueue 主 要 提供 出 队 和 入 队 两 个 方法 ， 如 下 所 示 : 





public void enqueue(byte[] data) throws IOException // 入 队 
public byte[] dequeue() throws IOException // 出 队 








与 上 节 介 绍 的 BasicDB 类 似 ， 消 恩 格 式 也 是 byte 数 组 。BasicQueue 的 
队列 长 度 是 有 限 的 ， 如 采 满 了 ， 调 用 enqueue 方 法 会 抛 出 民利 ;消息 的 
最 大 长 度 也 是 有 限 的 ， 不 能 超过 1020， 如 果 超 了 ， 也 会 抛 出 异常 。 如 果 
队列 为 室 ， 那 么 dequeue 方 法 返回 null。 


2. 用 法 示例 
BasicQueue 的 典型 用 法 是 生产 者 和 消费 者 之 间 的 协作 ， 我 们 来 看 下 


简单 的 示例 代码 。 生 产 者 程序 向 队列 上 放 消 息 ， 每 放 一 条 ， 束 随 机 体 奶 





public class Producer { 
public static void main(String[] args) throws InterruptedException { 


try { 
BasicQueue queue = new BasicQueue("./", "task"); 
int i = 0; 


Random rnd = new Random(); 

while(true) { 
String msg = new String("task "+ (i++)); 
queue.enqueue(msg.getBytes("UTF-8")); 
System,out.println("produce: " + msg); 
Thread.sleep(rnd.nextInt(1000)); 


} 
} catch (IOException e) { 
e.printSstackTrace(); 





消费 者 程序 从 队列 中 取消 轧 ， 如 果 队 列 为 空 ， 也 随机 休 妃 一 
代码 为 ; 





public class Consumer { 
public static void main(String[] args) throws InterruptedException { 
try { 
BasicQueue queue = new BasicQueue("./", "task"); 
Random rnd = new Random(); 
while (true) { 
byte[] bytes = queue ,dequeue() ; 
if(bytes == null) { 
Thread.sleep(rnd.nextInt(1000)); 
continue; 


System.out.println("consume: " + new String(bytes, "UTF-8")); 


} 
} catch (IOException e) { 
e.printSstackTrace(); 








假定 这 两 个 程序 的 当前 目录 一 样 ， 它 们 会 使 用 同样 的 队列 "task"。 
同时 运行 这 两 个 程序 ， 会 看 到 它们 的 输出 交 丛 出 现 。 





3. 设 计 
我 们 采用 如 下 简单 方式 来 设计 BasicQueue。 


1) 使 用 两 个 文件 来 保存 消息 队列 : 一 个 为 数据 文件 ， 扩 展 
为 .data; 一 个 是 元 数据 文件 .meta。 


2) 在 .data 文 件 中 使 用 固定 长 度 存储 每 条 信息 ， 长 度 为 1024， 前 4 个 
字 节 为 实际 长 度 ， 后 面 是 实际 内 容 ， 每 条 消息 的 最 大 长 度 不 能 超过 
1020。 


3) 在 .meta 文 件 中 保存 队列 尖 和 尾 ， 指 向 .data 文 件 中 的 位 置 ， 初 始 
0 入 队 增 加 尾 ， 出 队 增加 头 ， 到 结尾 时 ， 再 从 0 开始 ， 模 拟 循环 队 
有 7 








4) 为 了 区 分 队列 满 和 空 的 状态 ， 始 终 留 一 个 位 置 不 保存 数据 ， 当 
队列 头 和 队列 尾 一 样 的 时 候 表 示 队 列 为 空 ， 当 队列 尾 的 下 一 个 位 置 是 队 
列 头 的 时 候 表示 队列 满 。 


BasicQueue 的 基本 设计 如 图 14-3 所 示 。 


消息 实际 长 度 。 沉 息 最 大 长 度 
(4 字 节 ) ( 1020 字 节 ) 
| 
6 labdf 


meta 元 数据 文件 


.data 数 据 文 件 
图 14-3 ”BasicQueue 的 基本 设计 


为 简化 起 见 ， 我 们 暂 不 考虑 由 于 并 友 访 问 等 引起 的 一 致 性 问题 





14.3.4 实现 消息 队列 


下 面 来 看 BasicQueue 的 具体 实现 代码 ， 包 括 和 常量 定义 、 内 部 组 成 、 
构造 方法 、 入 队 、 出 队 等 。 


BasicQueue 中 定义 了 如 下 常量 ， 名 称 和 含义 如 下 : 








// 队 列 最 多 消息 个 数 ， 实 际 个 数 还 会 减 1 

private static final int MAX_MSG_NUM = 1020*1024 
// 消 息 体 最 大 长 度 

private static final int MAX_MSG_BODY_SIZE = 1020; 
// 每 条 消息 占用 的 空间 
private static final int MSG_SIZE = MAX_MSG_BODY_SIZE + 4; 

// 队 列 消息 体 数 据 文 件 大 小 

private static final int DATA_FILE SIZE = MAX_MSG_NUM * MSG_SIZE; 
// 队 列 元 数据 文件 大 小 (head + tail) 

private static final int META SIZE = 8; 












































BasicQueue 的 内 部 成 员 主要 就 是 两 个 MappedByteBuffer， 分 别 表 示 
数据 和 元 数据 : 





private MappedByteBuffer dataBuf; 
private MappedByteBuffer metaBuf ， 





BasicQueue 的 构造 方法 代码 是 : 





public BasicQueue(String path，String queueName) throws IOException { 
if(!path.endswith(File.separator)) { 
path += File.separator; 


} 

RandomAccessFile dataFile = null,; 

RandomAccessFile metaFile = null; 

try { 
dataFile = new RandomAccessFile(path + queueName + ".data", "rw"); 
metaFile = new RandomAccessFile(path + queueName + ".meta", "rw"); 


dataBuf = dataFile.getCchannel().map(MapMode .READ WRITE, 0, 
DATA_FILE_ SIZE); 
metaBuf = metaFile.getChannel().map(MapMode.READ_ WRITE, 0, 
META_SIZE); 
} finally { 
if(dataFile != null) { 
dataFile.close( ); 


} 

if(metaFile != null) { 
metaFile.close(); 

} 





为 了 方便 访问 和 修改 队列 头 尾 指 针 ， 我 们 定义 了 如 下 辅助 方法 : 





private int head() { 
return metaBuf .getInt(0); 
} 


private void head(int newHead) { 
metaBuf .putInt(0, newHead); 
} 


private int tail() { 
return metaBuf .getInt(4); 
} 


private void tail(int newTail) { 
metaBuf .putInt(4, newTail),; 
} 





为 了 便于 判断 队列 是 空 还 是 满 ， 我 们 定义 了 如 下 方法 : 





private boolean isEmpty(){ 
return head() == tail(); 
} 


private boolean isFull(){ 
return (tail() + MSG_ SIZE) % DATA_FILE_SIZE) == head(); 
} 





入 队 的 代码 为 : 





public void enqueue(byte[] data) throws IOException { 
if(data.length > MAX_MSG_ BODY_SIZE) { 
throw new IllegalArgumentException("msg size is " + data.length 
+ ", while maximum allowed length is " + MAX MSG BODY_SIZE); 


} 
if(isFull()) { 

throw new IllegalStateException("queue is full"); 
} 


int tail = tail(); 

dataBuf .position(tail); 

dataBuf .putInt(data.1length); 

dataBuf .put (data); 

if(tail + MSG_SIZE >= DATA_FILE_SIZE) { 
tail(0); 

} else { 
tail(tail + MSG_SIZE); 

} 





基本 化 辑 是 : 

1) 如 果 消 息 太 长 或 队列 满 ， 抛 出 开 第 ， 

2) 找到 队列 尾 ， 定 位 到 队列 尾 ， 写 消息 长 度 ， 写 实际 数据 ; 
3) 更 新 队列 尾 指 针 ， 如 果 已 到 文件 尾 ， 再 从 头 开始 。 





出 队 的 代码 为 : 





public byte[] dequeue() throws IOEXception { 
if(isEmpty()) £ 
return null; 


} 

int head = head(); 

dataBuf .position(head); 

int length = dataBuf .getInt(); 

byte[] data = new byte[length]; 

dataBuf .get (data); 

if(head + MSG_SIZE >= DATA_FILE_SIZE) { 
head(0); 

} else { 

head(head + MSG_SIZE ) ; 


} 
return data,; 





基本 逻辑 是 : 

1) 如 果 队 列 为 空 ， 返 回 null; 

2) 找到 队列 头 ， 定 位 到 队列 头 ， 读 消息 长 度 ， 读 实际 数据 ; 
3) 更 新 队列 头 指 针 ， 如 果 已 到 文件 尾 ， 再 从 头 开始 ; 

4) 最 后 返回 实际 数据 。 


ls A 


本 节 介 绍 了 内 存 上 映射 文件 的 基本 概念 及 在 Java 中 的 用 法 ， 在 日 音 普 
通 的 文件 读 写 中 ， 我 们 用 到 得 比较 少 ， 但 在 一 些 系统 程序 中 ， 它 却 是 经 
第 被 用 到 的 一 把 利器 ， 可 以 高 效 地 读 写 大 文件 ， 且 能 实现 不 同 程序 间 
的 共 至 和 通信 ，。 


利用 内 存 映 射 文 件 ， 我 们 设计 和 实现 了 一 个 简单 的 消 恩 队列 ， 消 奶 
可 以 持久 化 ， 可 以 实现 跨 程 序 的 生产 者 /消费 者 通信 ， 我 们 演示 了 这 个 
消 妃 队列 的 功能 、 用 法 、 设 计 和 实现 代码 。 











14.4 ”标准 序列 化 机 制 


在 前 面 几 节 ， 我 们 在 将 对 象 保 存 到 文件 时 ， 使 用 的 是 
DataOutputStream， 从 文件 读 入 对 象 时 ， 使 用 的 是 DataInputStream， 使 
用 它们 ， 需 要 逐个 处 理 对 象 中 的 每 个 字段 ， 我 们 提 到 ， 这 种 方式 比较 烦 
琐 ，Java 中 有 一 种 更 为 简单 的 机 制 ， 那 残 是 序列 化 。 


简单 来 说 ， 序 列 化 残 是 将 对 象 转化 为 字 市 流 ， 肥 序列 化 束 是 将 字 市 
注 转 化 为 对 象 。 在 Java 中 ， 具 体 如 何 来 使 用 呢 ? 它 是 如 何 实现 的 ? 有 什 
么 优 缺 点 ? 本 市 就 来 探讨 这 些 问 题 ， 我 们 先 从 它 的 基本 用 法 谈 起 。 











14.4.1 基本 用 法 





要 让 一 个 类 文 持 序列 化 ， 只 需要 让 这 个 类 实现 接口 
java.io.Serializable。Serializable 没 有 定义 任何 方法 ， 只 是 一 个 标记 接 
口 。 比 如 ， 对 于 前 面 章节 提 到 的 Student 类 ， 为 文 持 序列 化 ， 可 改 为 : 











public class Student implements Serializable { 
// 省 略 主体 代码 
} 


























声明 实现 了 Serializable 接 口 后 ， 保 存 / 读 取 Student 对 象 就 可 以 使 用 
ObjectOutput-StrearyVObjectInputStream 流 了 。ObjectOutputStream 是 
OutputStream 的 子 类 ， 但 实现 了 Object-Output 接 口 。ObjectOutput 是 
DataOutput 的 子 接口 ， 增 加 了 一 个 方法 : 





public void writeObject(Object obj) throws IOException 





这 个 方法 能 够 将 对 象 obj 转 化 为 字 节 ， 写 到 流 中 。 


ObjectInputStream 是 InputStream 的 子 类 ， 它 实现 了 ObjectInput 接 
口 。ObjectInput 是 DataInput 的 子 接口 ， 增 加 了 一 个 方法 : 





public Object readobject() throws ClassNotFoundException, IOException 





这 个 方法 能 够 从 流 中 读 取 字 节 ， 转 化 为 一 个 对 象 。 
使 用 这 两 个 流 ， 保 存 学 生 列 表 的 代码 就 可 以 变 为 : 





public static void writeStudents(List<Student> students) 
throws IOException { 
ObjectOutputStream out = new ObjectoutputStream( 
new BufferedoutputStream(new FileOutputStream("students.dat"))); 
try { 
out .writeInt(students.size()); 
for(Student s : students) { 
out ,writeobject(s)， 


} 
} finally { 
out.close( ); 
} 





而 从 文件 中 读 入 学 生 列 表 的 代码 可 以 变 为 : 





public static List<Student> readStudents() throws IOException, 
ClassNotFoundException { 
ObjectInputStream in = new ObjectInputStream(new BufferedInputStream( 
new FileInputStream("students.dat"))); 
try { 
int size = in.readIint(); 
List<Student> list = new ArrayList<>(size); 
for(int i = 0; i < size; i++) { 
list.add((Student) in,readobject()); 
} 


return list,; 
} finally { 

in.close( ); 
} 





实际 上 ， 只 要 List 对 象 也 实现 了 Serializable (ArrayList/LinkedList 都 
实现 了 ) ， 上 面 代码 还 可 以 进一步 简化 ， 读 写 只 需要 一 行 代码 ， 如 下 所 
小 : 








public static void writeStudents(List<Student> students) 
throws IOException { 
ObjectOutputStream out = new ObjectOutputStream( 
new BufferedoutputStream(new FileOutputStream("students.dat"))); 
try { 
out ,writeobject(students ) ; 
} finally { 


out.close( ); 


} 


} 
public static List<Student> readStudents() throws IOException, 
ClassNotFoundException 区 
ObjectInputStream in = new ObjectInputStream(new BufferedInputStream( 
new FileInputStream("students.dat"))); 
try { 
return (List<Student>) in.readobject(); 
} finally { 
in.close( ); 





是 不 是 很 神奇 ? 只 要 将 类 声明 实现 Serializable 接 口 ， 然 后 就 可 以 使 
用 ObjectOutput-Stream/ObjectInputStream 直 接 读 写 对 象 了 。 我 们 之 前 介 
绍 的 各 种 类 ， 如 String、Date、Double、ArrayList、LinkedList、 
HashMap、TreeMap 等 ， 都 实现 了 Serializable。 


14.4.2 ”复杂 对 象 


上 面 例 子 中 的 Student 对 象 是 非常 简单 的 ， 如 果 对 象 比 较 复 杂 呢 ? 比 
0: 


1) 如 果 a、b 两 个 对 象 部 引用 同一 个 对 象 ce， 序 列 化 后 c 是 保存 两 份 
还 是 一 份 ? 在 反 序列 化 后 还 能 让 a、b 指 向 同一 个 对 象 吗 ? 答案 是 ，c 只 
会 保存 一 份 ， 反 序列 化 后 指 癌 相同 对 象 。 


2) 如 果 a、b 两 个 对 象 有 循环 引用 呢 ?” 即 a 引用 了 b， 而 b 也 引用 了 
a。 这 种 情况 Java 也 没 问 题 ， 可 以 保持 引用 关系 。 


这 就 是 Java 序 列 化 机 制 的 神奇 之 处 ， 它 能 目 动 处 理 引 用 同一 个 对 象 
的 情况 ， 也 能 目 动 处 理 循 环 引用 的 情况 ， 有 基体 例子 我 们 就 不 介绍 了 ， 感 
兴趣 可 以 参看 微 信 公众 号 “ 老 马 说 编程 ?第 62 篇 文章 。 





14.4.3 ”定制 序列 化 


默认 的 序列 化 机 制 已 经 很 强大 了 ， 它 可 以 目 动 将 对 象 中 的 所 有 了 字段 
目 动 保存 和 恢复 ， 但 这 种 默认 行为 有 时 候 不 是 我 们 想 要 的 。 


对 于 有 些 字 段 ， 它 的 值 可 能 与 内 存 位 置 有 关 ， 比 如 默认 的 





hashCode〈) 方法 的 返回 值 ， 当 恢复 对 象 后 ， 内 存 位 置 衣 定 变 了 ， 基 于 
原 内 存 位 置 的 值 也 就 没有 了 意义 。 还 有 一 些 字段 ， 可 能 与 当前 时 间 有 
天 ， 比 如 表示 对 象 创建 时 的 时 间 ， 保 存 和 恢复 这 个 字段 就 是 不 正确 的 。 


还 有 一 些 情况 ， 如 果 类 中 的 字段 表示 的 是 类 的 实现 细节 ， 而 非 逻辑 
诗 息 ， 那 默认 序列 化 也 是 不 适合 的 。 为 什么 不 适合 呢 ? 因为 序列 化 格 
式 表 示 一 种 净 约 ， 应 该 描述 类 的 逻辑 结构 ， 而 非 与 实现 细节 相 绑 定 ， 绑 
定 实现 细节 将 使 得 难以 修改 ， 破 坏 封 装 。 


比如 ， 我 们 在 容器 类 中 介绍 的 LinkedList， 它 的 默认 序列 化 就 是 不 
适合 的 。 为 什么 呢 ? 因为 LinkedList 表 示 一 个 List， 它 的 逻辑 信息 是 列表 
的 长 度 ， 以 及 列表 中 的 每 个 对 象 ， 但 LinkedList 类 中 的 字段 表示 的 是 链 
如 头 尾 市 点 指针 ， 对 每 个 大 点 ， 还 有 前 驱 和 后 继 节 点 指 

so。 


那 怎 么 办 呢 ? Java 提 供 了 多 种 定制 序列 化 的 机 制 ， 主 要 的 有 两 种 : 
一 种 是 transient 关键 字 ， 另 外 一 种 是 实现 writeObject 和 readObject 方 法 。 


将 字段 声明 为 transient， 默 认 序 列 化 机 制 将 忽略 该 字段 ， 不 会 进行 
保存 和 恢复 。 比 如 ， 类 LinkedList 中 ， 它 的 字段 都 声明 为 了 transient， 如 
下 所 示 : 
































transient int size = 0; 
transient Node<E> first; 
transient Node<E> last; 





声明 为 了 transient， 不 是 说 就 不 保存 该 字段 了 ， 而 是 告诉 Java 默 认 
序列 化 机 制 ， 不 要 上 自动 保存 该 字段 了 ， 可 以 实现 writeObject/readObject 
方法 来 自己 保存 该 字段 。 


类 可 以 实现 writeObject 方 法 ， 以 和 目 定义 该 类 对 象 的 序列 化 过 程 ， 其 
声明 必须 为 : 








private void writeobject(java,io,.0bjectoutputStream s) 
throws java.io.IOException 








可 以 在 这 个 方法 中 ， 调 用 ObjectOutputStream 的 方法 向 流 中 写 入 对 


象 的 数据 。 比 如 ，LinkedList 使 用 如 下 代码 序列 化 列表 的 逻辑 数据 : 





private void writeobject(java,io,.0bjectoutputStream s) 
throws java.io.IOException { 
s.defaultwriteObject(); 

// 写 元 素 个 数 

s.writeInt(size); 

// 循 环 写 每 个 元 素 

for(Node<E> x = first; x != null; x = x.next) 
s.writeObject(x.item); 





需要 注意 的 是 代码 : 





s.defaultwriteObject(); 





这 一 行 是 必需 的 ， 它 会 调用 默认 的 序列 化 机 制 ， 默 认 机 制 会 保存 所 
有 没 声 明 为 transient 的 字段 ， 即 使 关中 的 所 有 字段 都 是 transient， 也 应 该 
写 这 一 行 ， 因 为 Java 的 序列 化 机 制 不 仅 会 保存 纯粹 的 数据 信息 ， 还 会 保 
存 一 些 元 数据 描述 等 隐藏 信息 ， 这 些 隐 藏 的 信息 是 序列 化 之 所 以 能 够 神 
奇 的 重要 原因 。 


与 writeObject 对 应 的 是 readObject 方 法 ， 通 过 它 自 定 义 肥 序列 化 过 
程 ， 其 声明 必须 为 : 














private void readobject(java,io.0bjectInputStream s) 
throws java.io.IOException, ClassNotFoundException 








在 这 个 方法 中 ， 调 用 ObjectInputStream 的 方法 从 流 中 读 入 数据 ， 然 
后 初始 化 类 中 的 成 员 变 量 。 比 如 ，LinkedList 的 反 序 列 化 代码 为 : 








private void readobject(java,io.0bjectInputStream s) 
throws java.io.IOException, ClassNotFoundException { 
s.defaultReadobject(); 

// 读 元 素 个 数 

int size = s.readInt(); 

// 循 环 读 入 每 个 元 素 

for (int i = 0; i < size; i++) 
linkLast((E)s.readobject()); 





注意 代码 : 





s.defaultReadobject(); 








这 一 行 代码 也 是 必需 的 。 
除了 自 定 义 writeObject/readObject 方 法 ， 还 有 一 些 自 定义 序列 化 过 


程 的 机 制 : Exter-nalizable 接 口 、readResolve 方 法 和 writeReplace 方 法 ， 
这 些 机 制 用 得 相对 较 少 ， 我 们 就 不 介绍 了 。 


14.4.4 序列 化 的 基本 原理 


稍微 总 结 一 下 。 


1) 如 果 类 的 字段 表示 的 就 是 类 的 逻辑 信息 ， 如 上 和 面 的 Student 类 ， 
那 就 可 以 使 用 默认 序列 化 机 制 ， 只 要 声明 实现 Serializable 接 口 即 可 。 


2) 否则 的 话 ， 如 LinkedList， 那 就 可 以 使 用 transient 关 键 字 ， 实 现 
writeObject 和 read-Object 自 定义 序列 化 过 程 。 


3) Java 的 序列 化 机 制 可 以 自动 处 理 如 引用 同一 个 对 象 、 循 环 引用 


等 情况 。 


序列 化 到 底 是 如 何 发 生 的 呢 ? 关键 在 ObjectOutputStream 的 
writeObject 和 ObjectInput-Stream 的 readObject 方 法 内 。 它 们 的 实现 都 非常 
复杂 ， 正 因为 这 些 复 杂 的 实现 才 使 得 序列 化 看 上 去 很 神奇 ， 我 们 简单 介 
绍 其 基本 逻辑 。 


writeObject 的 基本 逻辑 是 : 


1) 如 果 对 象 没 有 实现 Serializable， 抛 出 异常 
NotSerializableException 。 


2) 每 个 对 象 都 有 一 个 编号 ， 如 有 果 之 前 已 经 写 过 该 对 象 了 ， 则 本 次 
只 会 写 该 对 象 的 引用 ， 这 可 以 解决 对 象 引 用 和 循环 引用 的 问题 。 


3) 如 果 对 象 实现 了 writeObject 方 法 ， 调 用 它 的 自 定 义 方法 。 





4) 默认 是 利用 反射 机 制 〈 反 射 在 第 21 章 介绍 ) ， 明 历 对 象 结构 
图 ， 对 每 个 没有 标记 为 transient 的 字段 ， 根 据 其 类 型 ， 分 别 进行 处 理 ， 
与 出 到 流 ， 流 中 的 信息 包 丘 字段 的 闫 王 ， 即 完整 闫 名、 字段 名 、 字 段 但 








readObject 的 基本 逻辑 是 : 
1) 不 调用 任何 构造 方法 ; 


2) 它 上 自己 束 相 当 于 是 一 个 独立 的 构造 方法 ， 根 据 字 市 流 初 始 化 对 
象 ， 利 用 的 也 是 反射 机 制 ; 


3) 在 解析 字 节 流 时 ， 对 于 引用 到 的 类 型 信息 ， 会 动态 加 载 ， 如 果 
找 不 到 类 ， 会 抛 出 ClassNotFoundException 。 


14.4.5 ”版 本 问题 


前 面 的 介绍 ， 我 们 忽略 了 一 个 问题 ， 那 残 是 版 本 问题 。 我 们 知道 ， 
代码 是 在 不 断 演化 的 ， 而 序列 化 的 对 象 可 能 是 持久 保存 在 文件 上 的 ， 如 
果 类 的 定义 发 生 了 变化 ， 那 持久 化 的 对 象 还 能 反 序列 化 吗 ? 


默认 情况 下 ，Java 会 给 类 定义 一 个 版 本 号 ， 这 个 版 本 号 是 根据 类 中 
一 系列 的 信息 自动 生成 的 。 在 反 序 列 化 时 ， 如 果 类 的 定义 发 生 了 变化 ， 
版 本 号 就 会 变化 ， 与 流 中 的 版 本 号 台 会 不 匹配 ， 反 序列 化 就 会 抛 出 腊 


和 常 ， 类 型 为 java.io.InvalidClassException。 


通常 情况 下 ， 我 们 希望 目 定 义 这 个 版 本 号 ， 而 非 让 Java 目 动 生成 ， 
一 方面 是 为 了 更 好 地 控制 ， 另 一 方面 是 为 了 性 能 ， 因 为 Java 目 动 生 成 的 
性 能 比较 低 。 怎 么 目 定 义 呢 ? 在 类 中 定义 如 下 变量 : 











private static final long serialVersionUID = 1L; 





在 Java IDE 如 Eclipse 中 ， 如 果 声 明 实现 了 Serializable 而 没有 定义 该 
变量 ，IDE 会 提示 上 自动 生成 。 这 个 变量 的 值 可 以 是 任意 的 ， 代 表 该 类 的 
版 本 号 。 在 序列 化 时 ， 会 将 该 值 写 入 流 ， 在 反 序列 化 时 ， 会 将 流 中 的 值 
与 类 定义 中 的 值 进行 比较 ， 如 果 不 匹 配 ， 会 抛 出 InvalidClassException 。 





那 如 果 版 本 号 一 样 ， 但 实际 的 字段 不 匹配 昵 ? Java 会 分 情况 目 动 进 
行 处 理 ， 以 尽量 保持 兼容 性 ， 大 概 分 为 三 种 情况 : 


字段 删 掉 了 : 即 流 中 有 该 字段 ， 而 类 定义 中 没有 ， 该 字段 会 被 名 


-新 增 了 字段 : 即 类 定义 中 有 ， 而 流 中 没有 ， 该 字段 会 被 设 为 默认 








.字段 类 型 变 了 : 对 于 同名 的 字段 ， 类 型 变 了 ， 会 抛 出 


InvalidClassException。 





14.4.6 ”序列 化 特点 分 析 


序列 化 的 主要 用 途 有 两 个 : 一 个 是 对 象 持久 化 ; 男 一 个 是 跨 网 络 的 
数据 交换 、 远 程 过 程 调用 。Java 标 准 的 序列 化 机 制 有 很 多 优点 ， 使 用 简 
单 ， 可 上 自动 处 理 对 象 引 用 和 循环 引用 ， 也 可 以 方便 地 进行 定制 ， 处 理 版 
本 问题 等 但 它 也 有 一 些 重要 的 局 限 性 。 


1) Java 序 列 化 格式 是 一 种 私有 格式 ， 是 一 种 Java 特 有 的 技术 ， 不 能 
被 其 他 语言 识别 ， 不 能 实现 路 语言 的 数据 交换 。 


2) Java 在 序列 化 字 贡 中 保存 了 很 多 描述 信息 ， 使 得 序列 化 格式 比 








较 大 
3) Java 的 默认 序列 化 使 用 反 则 分 析 志 历 对 象 结构 ， 性 能 比较 低 。 
4) Java 的 序列 化 格式 是 二 进 制 的 ， 不 方便 查看 和 修改 。 


由 于 这 些 局 限 性 ， 实 践 中 往往 会 使 用 一 些 普 代 方案 。 在 路 语言 的 数 
据 交 换 格式 中 ，XML/JSON 是 被 广泛 采用 的 文本 格式 ， 各 种 语言 都 有 对 
它们 的 支持 ， 文 件 格 式 清晰 易 读 。 有 很 多 查看 和 编辑 工具 ， 它 们 的 不 足 
之 处 是 性 能 和 序列 化 大 小 ， 在 性 能 和 大 小 敏感 的 领域 ， 往 往 会 采用 更 为 
精简 高 效 的 二 进 制 方式 ， 如 ProtoBuf、Thrift、MessagePack 等 。 


至 此 ， 关 于 Java 的 标准 序列 化 机 制 就 介绍 完了 。 我 们 介绍 了 它 的 用 
法 和 基本 原理 ， 最 后 分 析 了 它 的 特点 ， 它 是 一 种 神奇 的 机 制 | 通过 简单 














的 Serializable 接 口 就 能 自动 处 理 很 多 复杂 的 事情 ， 但 它 也 有 一 些 重 要 的 
限制 ， 最 重要 的 是 不 能 跨 语 言 。 








14.5 ”使 用 Jackson 序 列 化 为 
JSON/XML/MessagePack 


由 于 Java 标 准 序列 化 机 制 的 一 些 限制 ， 实 践 中 经 常 使 用 一 些 蔡 代 方 
案 ， 比 如 XML/JSON/MessagePack。Java SDK 中 对 这 些 格式 的 支持 有 
限 ， 有 很 多 第 三 方 的 类 库 提供 了 更 为 方便 的 支持 ，Jackson 是 其 中 一 种 ， 
它 支持 多 种 格式 ， 包 括 XML/JSOINVMessagePack 等 ， 本 节 就 来 介绍 如 何 
使 用 Jackson 进 行 序列 化 。 我 们 先 来 简单 了 解 下 这 些 格式 以 及 Jackson。 








14.5.1 基本 概念 


XML/JSON 都 是 文本 格式 ， 都 容易 阅读 和 理解 ， 格 式 细 市 我 们 就 不 
介绍 了 ， 后 面 我 们 会 看 到 一 些 例子 ， 来 演示 其 基本 格式 。XML 是 最 早 
流行 的 路 语言 数据 交换 标准 格式 ， 如 有 果 不 熟 悉 ， 可 以 耕 
看 http:/www.w3school.com.cn/xml/ 快速 了 解 。JSON 是 一 种 更 为 简单 的 
格式 ， 最 近 几 年 来 越 来 越 流 行 ， 如 果 不 熟 悉 ， 可 以 碍 
看 http:Wjson.org/json-zh.html 。MessagePack 是 一 种 二 进 制 形式 的 JSON， 
编码 更 为 精简 高 效 ， 官 网 地 址 是 http://msgpack.org/。JSON 有 多 种 二 进 制 
形式 ，MessagePack 只 是 其 中 一 种 。 








Jackson 的 Wiki 地 址 是 http://wiki.fasterxml.com/JacksonHome ， 它 起 
初 主要 是 用 来 支持 JSON 格 式 的， 现在 也 文 持 很 多 其 他 格式 ， 它 的 各 种 
方式 的 使 用 方式 是 类 似 的 。 要 使 用 Jackson， 需 要 下 载 相 应 的 库 。 对 于 
JSON/XML， 本 节 使 用 2.8.5 版 本 ， 对 于 MessagePack， 本 节 使 用 0.8.11 版 
本 ， 所 有 依赖 库 均 可 从 以 下 地 址 下 
载 : https://github.com/swiftma/program-logic/tree/master/jackson_libs 。 配 


置 好 依赖 库 后 ， 下 面 我 们 就 来 介绍 如 何 使 用 。 
14.5.2 ”基本 用 法 


我 们 还 是 通过 Student 类 来 演示 Jackson 的 基本 用 法 ， 格 式 包括 
JSON、XML 和 Message-Pack。 


1.JSON 
序列 化 一 个 Student 对 象 的 基本 代码 为 : 





Student student = new Student(" 张 三 ", 18, 80.9d); 
ObjectMapper mapper = new ObjectMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper .writeValueAsString(student); 
System,.out.println(str); 





Jackson 序 列 化 的 主要 类 是 ObjectMapper， 它 是 一 个 线程 安全 的 类 ， 
可 以 初始 化 并 配置 一 次 ， 被 多 个 线程 共享 ， 
SerializationFeature.INDENT_OUTPUT 的 目的 是 格式 化 输出 ， 以 便于 阅 
读 。ObjectMapper 的 writeValueAsString 方 法 就 可 以 将 对 象 序 列 化 为 字符 
串 ， 输 出 为 : 





name" "二 
"age" : 18, 
"score" : 80.9 


} 





ObjectMapper 还 有 其 他 方法 ， 可 以 输出 字 节 数组 ， 写 出 到 文件 、 
OutputStreaam、Writer 等 ， 方 法 声明 如 下 : 





public byte[] writevalueAsBytes(O0bject value) 

public void writevalue(OutputStream out, Object value) 
public void writeValue(Writer w, Object value) 

public void writeValue(File resultFile, Object value) 





比如 ， 输 出 到 文件 "student.json"， 代 码 为 : 





mapper .writeValue(new File("student.json"), student); 





ObjectMapper 怎 么 知道 要 保存 哪些 字段 呢 ? 与 Java 标 准 序列 化 机 制 
一 样 ， 它 也 使 用 反射 ， 默 认 情 况 下 ， 它 会 保存 所 有 声明 为 public 的 字 
段 ， 或 者 有 public getter 方 法 的 字段 。 


反 序 列 化 的 代码 如 下 所 未: 











ObjectMapper mapper = new ObjectMapper(); 
Student s = mapper ,readvalue(new File("student.json"), Student.class); 
System,out.println(s,toString())， 





使 用 readValue 方 法 反 序 列 化 ， 有 两 个 参数 : 一 个 是 输入 源 ， 这 里 是 
文件 student.json; 另 一 个 是 反 序 列 化 后 的 对 象 类 型 ， 这 里 是 
Student.class， 输 出 为 : 





Student [name= 张 三 ，age=18， score=80.9] 





说 明 反 序列 化 的 结果 是 正确 的 ， 除 了 接受 文件 ， 还 可 以 是 字 市 数 
组 、 字 符 串 、Input-Stream、Reader 等 ， 如 下 所 示 : 





public <T> T readValue(InputStream src, Class<T> valueType) 
public <T> T readValue(Reader src, Class<T> valueType) 
public <T> T readValue(String content, Class<T> valueType) 
public <T> T readValue(byte[] src, Class<T> valueType) 





在 反 序 列 化 时 ， 默 认 情况 下 ，Jackson 假 定 对 象 类 型 有 一 个 无 参 的 构 
它 会 先 调 用 该 构造 方法 创建 对 象 ， 然 后 解析 输入 源 进行 反 序列 


2.XML 


使 用 类 似 的 代码 ， 格 式 可 以 为 XML， 唯 一 需要 改变 的 是 蔡 换 
ObjectMapper 为 Xml-Mapper。XmlMapper 是 ObjectMapepr 的 子 类 ， 序 列 
化 代码 为 : 








Student student = new Student(" 张 三 ", 18, 80.9d); 
ObjectMapper mapper = new XmlMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper .writeValueAsString(student); 
mapper .writeValue(new File("student.xm]l"), student); 
System.out.println(str); 





输出 为 : 





<Student> 


<name> 张 三 </name> 

<age>18</age> 

<score>80.9</score> 
</Student> 





反 序 列 化 代码 为 : 





ObjectMapper mapper = new XmlMapper(); 
Student s = mapper.readValue(new File("student.xm]l"), Student.class); 
System.out.println(s.toSstring()); 





3.MessagePack 


类 似 的 代码 ， 格 式 可 以 为 MessagePack， 同 样 使 用 ObjectMapper 
类 ， 但 传递 一 个 Mess-agePackFactory 对 象 。 另 外 ，MessagePack 是 二 进 
制 格 式 ， 不 能 写 出 为 String， 可 以 写 出 为 文件 、OutpuStream 或 字 节 数 
组 。 序 列 化 代码 为 : 





Student student = new Student(" 张 三 ", 18, 80.9d); 

ObjectMapper mapper = new ObjectMapper (new MessagePackFactory()); 
byte[] bytes = mapper .writeValueAsBytes(student); 

mapper .writeValue(new File("student.bson"), student); 





序列 后 的 字 市 如 图 14-4 所 示 。 


00000000h: 83 A4 6E 61 6D 65 A6 ES5 BC R0O E4 B8 89 A3 61 67 ; .Mname|&%.8,.£ag 


00000010h: 65 12 A5 73 63 6F 72 65 CB 40 54 39 99 99 99 99 ; e.¥scoreE@T9.... 
00000020h: 9AL ; 


ff * 





图 14-4 ”MessagePack 序 列 化 示例 
反 序 列 化 代码 为 : 





ObjectMapper mapper = new ObjectMapper (new MessagePackFactory()); 
Student s = mapper.readValue(new File("student.bson"), Student.class); 
System.out.println(s.toSstring()); 





14.5.3 ， 窜 加 对象 


对 于 容器 对 象 ，Jackson 也 是 可 以 上 自动 处 理 的 ， 但 用 法 稍 有 不 同 ， 我 
们 来 看 下 List 和 Map。 


1.List 


序列 化 一 个 学 生 列 表 的 代码 为 : 





List<Student> students = Arrays.asList(new Student[] 
new Student(" 张 三 ",，18, 80.9d), new Student(' 

ObjectMapper mapper = new ObjectMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 

String str = mapper .writeValueAsString(students); 

mapper .writeValue(new File("students.json"), students); 

System,.out.println(str); 


{ 
' 李 四 "，17，67.5d) }); 








这 与 序列 化 一 个 学 生 对 象 的 代码 是 类 似 的 ， 输 出 为 : 








| " 张 三 " 
an = 理 
"age" : 18, 
"score" : 80.9 
uname ' 0 
"age" : 17, 
"score" : 67.5 
}] 








反 序 列 化 代码 不 同 ， 要 新 建 一 个 TypeReference 匿 名 内 部 类 对 象 来 指 
定 类 型 ， 代 码 如 下 所 示 : 





ObjectMapper mapper = new ObjectMapper(); 

List<Student> list = mapper.readValue(new File("students.json"), 
new TypeReference<List<Student>>() {0}); 

System.out.println(list.tostring()); 





XMIL/MessagePack 的 代码 是 类 似 的 ， 我 们 就 不 袭 述 了 。 
2.Map 


Map 与 List 类 似 ， 序 列 化 不 需要 特殊 处 理 ， 但 反 序 列 化 需要 通过 
0 我 们 看 一 个 XML 的 例子 。 序 列 化 一 个 学 生 Map 
代码 为 ; 





有 一 


Map<String, Student> map = new HashMap<String, Student>(); 
map.put("zhangsan", new Student(" 张 三 ", 18, 80.9d)); 
map.put("lisi", new Student(" 李 四 ", 17, 67.5d)); 
ObjectMapper mapper = new XmlMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 

String str = mapper .writeValueAsString(map); 

mapper .writeValue(new File("students map.xml"), map); 
System,.out.println(str); 

















输出 为 : 





<HashMap> 
<lisi> 
<name> 李 四 </name> 
<age>17</age> 
<score>67.5</score> 
</lisi> 
<zhangsan> 
<name> 张 三 </name> 
<age>18</age> 
<score>80.9</score> 
</zhangsan> 
</HashMap> 





肥 序列 化 的 代码 为 : 





ObjectMapper mapper = new XmlMapper(); 

Map<String, Student> map = mapper.readValue(new File("students map.xml"), 
new TypeReference<Map<String, Student>>() {}); 

System,out.println(map.toString())， 





14.5.4 复杂 对 象 


对 于 复杂 一 些 的 对 象 ，Jackson 也 是 可 以 自动 处 理 的 ， 我 们 让 
Student 类 稍微 复杂 一 些 ， 改 为 如 下 定义 : 





public class ComplexStudent { 
String name,; 
int age; 
Map<String, Double> scores,; 
ContactInfo contactInfo ， 
// 省 略 构 造 方法 和 getter/setter 方 法 








分 数 改 为 一 个 Map， 键 为 课程 ，ContactInfo 表 示 联 系 信息 ， 是 一 个 
单独 的 类 ， 定 义 如 下 : 





public class ContactInfo { 
String phone; 
String address ; 
String email; 
// 和 省略 构造 方法 和 getter/setter 方 法 




















} 





构建 一 个 ComplexStudent 对 象 ， 代 码 为 : 





ComplexStudent student = new ComplexStudent(" 张 三 ", 18); 
Map<String, Double> scoreMap = new HashMap<>(); 
scoreMap .put(" 语 文 "，89d ) ; 

scoreMap .put(" 数 学 "，83d) ; 

Student .setScores(ScoreMap ) ; 

ContactInfo contactInfo = new ContactInfo(); 
contactInfo.setPhone("18500308990" ) ; 
contactInfo.setEmail("zhangsan@sina.com"); 
contactInfo.setAddress(" 中 关 村 ")， 
student.setContactIinfo(contactInfo); 





我 们 看 JSON 序 列 化 ， 代 码 没 有 特殊 的 ， 如 下 所 示 : 





ObjectMapper mapper = new ObjectMapper(); 
mapper .enable(SerializationFeature.INDENT_OUTPUT); 
mapper .writeValue(System.out, student); 





输出 为 : 








{ "name" : " 张 三 "， 
"age" : 18, 
"scores" : { 
"语文 " 89.0, 
"数学 " 83.0 
}, 
"contactInfo" : { 
"phone" : "18500308990", 
"address" : "中 关 村 "， 
"email" : "zhangsan@sina.com" 
} 
} 
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XML 格式 的 代码 也 是 类 似 的 ， 蔡 换 ObjectMapper 为 XmlMapper 即 
可 ， 输 出 为 : 





<ComplexSstudent> 
<name> 张 三 </name> 
<age>18</age> 
<scores> 
< 语文 >89 .0</ 语 文 > 
< 数学 >83 .0</ 数 学 > 
</scores> 
<contactInfo> 
<phone>18500308990</phone> 
<address> 中 关 村 </address> 
<email>zhangsan@sina.com</email> 
</contactIinfo> 
</ComplexStudent> 








反 序 列 化 的 代码 也 不 需要 特殊 处 理 ， 指 定 类 型 为 
ComplexStudent.class 即 可 。 


14.5.5 ”定制 序列 化 


上 面 的 例子 中 ， 我 们 没有 做 任何 定制 ， 默 认 的 配置 就 是 可 以 的 。 但 
很 多 情况 下 ， 我 们 需要 做 一 些 配 置 ，Jackson 主 要 支持 两 种 配置 方法 。 


1) 注解 ， 后 续 章 节 会 详细 介绍 注解 ， 这 里 主要 是 介绍 Jackson 一 些 
注解 的 用 法 。 


2) 配置 ObjectMapper 对 象 ，ObjectMapper 支 持 对 序列 化 和 反 序 列 化 
过 程 做 一 些 配 置 ， 前 面 使 用 的 SerializationFeature.INDENT_OUTPUT 是 
其 中 一 种 。 


哪些 情况 再 要 配置 呢 ? 我们 看 一 些 典 型 的 场景 。 


1) 配置 达到 类 似 标准 序列 化 中 transient 关 键 字 的 效果 ， 忽 上 略 一 些 字 
> 


2) 在 标准 序列 化 中 ， 可 以 自动 处 理 引 用 同一 个 对 象 、 循 环 引 用 的 
情况 ， 反 序列 化 时 ， 可 以 目 动 忽略 不 认识 的 字段 ， 可 以 目 动 处 理 继 承 多 
态 ， 但 Jackson 都 不 能 自动 处 理 ， 这 些 情 况 都 需要 进行 配置 。 











3) 标准 序列 化 的 结果 是 二 进 制 、 不 可 读 的 ， 但 XML/JSON 格 式 是 
可 读 的 ， 有 时 我 们 希望 控制 这 个 显示 的 格式 。 


4) 默认 情况 下 ， 反 序列 时 ，Jackson 要 求 类 有 一 个 无 参 构造 方法 ， 
但 有 时 类 没有 无 参 构造 方法 ，Jackson 文 持 配置 其 他 构造 方法 。 


针对 这 些 场景 ， 我 们 分 别 介 绍 。 
1. 忽 略 字段 


在 Java 标 准 序列 化 中 ， 如 果 字 段 标记 为 了 transient， 束 会 在 序列 化 
中 被 忽略 ， 在 Jack-son 中 ， 可 以 使 用 以 下 两 个 注解 之 一 。 


.@JsonIgnore: 用 于 字段 、getter 或 setter 方 法 ， 任 一 地 方 的 效果 都 一 
样 。 








`@JsonIgnoreProperties: 用 于 类 声明 ， 可 指定 忽略 一 个 或 多 个 字 
段 。 


比如 ， 上 面 的 Student 类 ， 和 忽略 分 数字 段 ， 可 以 为 : 





@JsonIgnore 
double score; 





也 可 以 修饰 getter 方 法 ， 如 : 





@JsonIgnore 
public double getScore() { 
return score; 


} 





也 可 以 修饰 Student 类 ， 如 : 





@JsonIgnoreProperties("score") 
public class Student { 








加 了 以 上 任 一 标记 后 ， 序 列 化 后 的 结果 中 将 不 再 包含 Score 字段 ， 在 
反 序 列 化 时 ， 即 使 输入 源 中 包含 score 字 段 的 内 容 ， 也 不 会 给 score 字 段 


赋值 。 
2. 引 用 同一 个 对 象 
我 们 看 个 简单 的 例子 ， 有 两 个 类 Common 和 A，A 中 有 两 个 Common 


对 象 ， 为 便于 演示 ， 我 们 将 所 有 属性 定义 为 了 public， 它 们 的 类 定义 如 
下 : 





static class Common { 
public String name; 


static class Af 
public Common first; 
public Common second ; 





有 一 个 A 对 象 ， 如 下 所 示 : 





Common c = new Common(); 
c.nName= "common™"; 

Aa= new A(); 

a.first = a.second = c; 





a 对 象 的 first 和 second 都 指 癌 都 一 个 c 对 象 ， 不 加 额外 配置 ， 序 列 化 a 
的 代码 为 : 





ObjectMapper mapper = new ObjectMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper .writeValueAsString(a); 
System.out.println(str); 





输出 为 : 





{ 
"first" : { 
"name" : "abc" 
}, 
"second™" : { 
"name" : "abc" 
} 


在 反 序列 化 后 ，first 和 second 将 指 癌 不 同 的 对 象 ， 如 下 所 示 : 





A a2 = mapper.readValue(str, A.class); 


if(a2.first == a2.Second ){ 
System.out.printin("reference same object"); 
}elsef{ 


System.out.printin("reference different objects"); 





输出 为 : 





reference different objects 





那 怎 样 才 能 保持 这 种 对 同一 个 对 象 的 引用 关系 呢 ? 可 以 使 用 注解 
@JsonIdentityInfo， 对 Common 类 做 注解 ， 如 下 所 示 : 





@JsonIdentityInfo( 
generator = ObjectIdGenerators.IntSequenceGenerator ,class， 
property="id") 
static class Common { 
public String name; 





(@JsonIdentityInfo 中 指定 了 两 个 属性 ，property="id" 表 示 在 序列 化 输 
出 中 新 增 一 个 属性 "id" 以 表示 对 象 的 唯一 标示 ，generator 表 示 对 象 唯 一 
ID 的 产生 方法 ， 这 里 是 使 用 整数 顺序 数 产 生 器 IntSequenceGenerator。 


加 了 这 个 标记 后 ， 序 列 化 输出 会 变 为 : 





"first" : { 

"1id" > 1, 

"name™" : "common" 
"second" : 1 


} 








注意 : "first" 中 加 了 一 个 属性 "id"， 而 "second" 的 值 只 是 1， 表 示 引 用 
第 一 个 对 象 ， 这 个 格式 反 序 列 化 后 ，first 和 second 会 指 问 同一 个 对 象 。 


3. 循 环 引 用 


我 们 看 个 循环 引用 的 例子 。 有 两 个 类 Parent 和 Child， 它 们 相互 引 
用 ， 为 便于 演示 ， 我 们 将 所 有 属性 定义 为 了 public， 类 定义 如 下 : 





static class Parent I{ 
public String name; 
public Child child; 


} 

static class Child { 
public String name; 
public Parent parent; 


} 





有 一 个 对 象 ， 如 下 所 示 : 





Parent parent = new Parent(); 
parent.name = " 老 马 " 

Child child = new Child(); 
child.name = "小 马 " 
parent.child child; 
child.parent parent ， 





如 果 序 列 化 parent 这 个 对 象 ，Jackson 会 进入 无 限 循 环 ， 最 终 抛 出 异 
常 ， 解 决 这 个 问题 ， 可 以 分 别 标记 Parent 类 中 的 child 和 Child 类 中 的 
parent 字 段 ， 将 其 中 一 个 标记 为 主 引 用 ， 而 另 一 个 标记 为 反 癌 引用， 主 
引用 使 用 @JsonManagedReference， 反 向 引用 使 用 
@JsonBackReference， 如 下 所 示 : 





static class Parent ff{ 
public String name; 
@JsonManagedReference 
public Child child; 


static class Child { 
public String name; 
@JsonBackReference 
public Parent parent; 


} 








人 加 了 这 个 注解 后 ， 序 列 化 就 没有 问题 了 。 我 们 看 XML 格 式 的 序列 
代码 ; 





ObjectMapper mapper = new XmlMapper(); 
mapper .enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper .writeValueAsString(parent); 


System.out.println(str); 





输出 为 : 





<Parent> 
<name> 老 马 </name> 
<child> 
<name> 小 马 </name> 
</child> 
</Parent> 





在 输出 中 ， 反 回 引 用 没有 出 现 。 不 过 ， 在 反 序 列 化 时 ，Jackson 会 目 
动 设置 Child 对 象 中 的 parent 字 段 的 值 ， 比 如 : 





Parent parent2 = mapper.readValue(str, Parent.class); 
System.out.println(parent2.child.parent.name); 





输出 为 : 老 蕊 。 说 明 标记 为 反问 引 用 的 字段 的 值 也 被 正确 设置 了 。 
4. 反 序列 化 时 忽略 未 知 字段 
在 Java 标 准 序列 化 中 ， 反 序列 化 时 ， 对 于 未 知 字段 会 自动 忽略 ， 但 


在 Jackson 中 ， 默 认 情 况 下 会 抛 出 异常 。 还 是 以 Student 类 为 例 ， 如 果 
student.json 文 件 的 内 容 为 : 
































name" 张 三 

age"”: 18 

Score": 333, 

other" 其 他 信息 
} 





其 中 ，other 属 性 是 Student 类 没有 的 ， 如 果 使 用 标准 的 反 序列 化 代 





ObjectMapper mapper = new ObjectMapper(); 
Student s = mapper ,readvalue(new File("student.json"), Student.class); 





Jackson 会 抛 出 异常 : 





com.fasterxml.jackson.databind.exc.UnrecognizedPropertyException: Unrecognized fiel( 





怎样 才能 忽略 不 认识 的 字段 呢 ? 可 以 配置 ObjectMapper， 如 下 所 


人 外: 





ObjectMapper mapper = new ObjectMapper(); 
mapper .disabJe(DeserializationFeature,FAIL_ON_UNKNOWN_PROPERTIES ) ， 
Student s = mapper.readValue(new File("student.json"), Student.class); 





这 样 就 没 问 题 了 ， 这 个 属性 是 配置 在 整个 ObjectMapper 上 的 ， 如 果 
只 是 希望 配置 Student 类 ， 可 以 在 Student 类 上 使 用 如 下 注解 : 





@JsonIgnoreProperties(ignoreUnknown=true) 
public class Student { 

//... 

} 





5. 继 承 和 多 态 


Jackson 也 不 能 自动 处 理 多 态 的 情况 。 我 们 看 个 例子 ， 有 4 个 类 ， 定 
义 如 下 ， 我 们 忽略 了 构造 方法 和 gettersetter 方 法 : 





static class Shape { 


} 
static class Circle extends Shape { 
private int r,; 


static class Square extends Shape { 
private int 1; 


static class ShapeManager { 
private List<Shape> shapes; 
} 





ShapeManager 中 的 Shape 列 表 中 的 对 象 可 能 是 Circle， 也 可 能 是 
Square。 比 如 ， 有 一 个 ShapeManager 对 象 ， 如 下 所 示 : 





ShapeManager sm = new ShapeManager(); 
List<Shape> shapes = new ArrayList<Shape>(); 
shapes.add(new Circle(10)); 

shapes.add(new Square(5)); 


sm.setShapes(shapes); 





使 用 JSON 格 式 序 列 化 ， 输 出 为 : 





‘ 
"shapes"” :; [ { 
"r" ;10 
}, { 
Fy ' 5 
}] 
} 








这 个 输出 看 上 去 是 没有 问题 的 ， 但 由 于 输出 中 没有 类 型 信息 ， 反 序 
列 化 时 ，Jackson 不 知道 具体 的 Shape 类 型 是 什么 ， 就 会 抛 出 异常 。 


解决 方法 是 在 输出 中 包含 类 型 信息 ， 在 基 类 Shape 前 使 用 如 下 注 
解 : 





@JsonTypeInfo(use = Id.NAME, include = As.PROPERTY, property = "type") 
@JsonSubTypes(({ 
@JsonSubTypes ,Type(value = Circle.class, name 
@JsonSubTypes,Type(value = Square.class, name 
static class Shape { 


"circle"), 
"square") }) 





这 些 注解 看 上 去 比较 多 ， 含 义 是 指 在 输出 中 增加 属性 "type"， 表 示 
对 象 的 实际 类 型 ， 对 Circle 类 ， 使 用 "circle" 表 示 其 类 型 ， 而 对 于 Square 
类 ， 使 用 "square"。 加 了 注解 后 ， 序 列 化 输出 变 为 : 





{ 
"shapes"” :; [ { 
"type” : "circle", 
"r" : 10 
}, { 
"type" : "square", 
Th ' 5 
}] 
} 





这 样 ， 反 序列 化 时 残 可 以 正确 解析 了 。 
6. 修 改 字 段 名 称 


对 于 XML/JSON 格 式 ， 有 时 ， 我 们 希望 修改 输出 的 名 称 ， 比 如 对 
Student 类 ， 我 们 希望 输出 的 字段 名 变 为 对 应 的 中 文 ， 可 以 使 用 
@JsonProperty 进 行 注 解 ， 如 下 所 示 : 








public class Student { 
@JsonProperty(" 名 称 " 
String name 
@JsonProperty(" 年 龄 ") 
int age; 
@JsonProperty(" 分 数 " 
double score; 


— 





— 








名 称 " 张 三 

年 龄 " 18 

"分 数 " 80 .9 
} 








对 于 XML 格 式 ， 一 个 常用 的 修改 是 根 元 素 的 名 称 。 默 认 情 况 下 ， 
它 是 对 象 的 类 名 ， 比 如 对 Student 对 象 ， 它 是 "Student"， 如 果 和 硕 望 修改 ， 
比如 改 为 小 写 "student"， 可 以 使 用 @JsonRootName 修 饰 整个 类 ， 如 下 所 
未: 





@JsonRootName("student") 
public class Student { 





7. 格 式 化 日 期 
默认 情况 下 ， 日 期 的 序列 化 格式 为 一 个 长 整数 ， 比 如 : 





static class MyDate { 
public Date date = new Date(); 
} 





序列 化 代码 : 





MyDate date = new MyDate( ) ; 
ObjectMapper mapper = new ObjectMapper(); 
mapper .writeValue(System.out, date); 





输出 如 下 所 示 : 





{"date":1482758152509} 





这 个 格式 是 不 可 读 的 ， 怎 样 才 能 可 读 呢 ? 使 用 @JsonFormat 注 解 ， 
如 下 所 示 : 





static class MyDate { 
@JsonFormat (pattern="yyyy-MM-dd HH:mm:ss", timezone="GMT+8") 
public Date date = new Date(); 





加 注解 后 ， 输 出 变 为 如 下 所 示 : 





{"date":"2016-12-26 21:26:18"} 





8. 配 置 构造 方法 


前 面 的 Student 类 ， 如 果 没 有 定义 默认 构造 方法 ， 只 有 如 下 构造 方 
法 : 





public Student(String name, int age, double score) { 
this.name = name; 
this.age = age; 
this.score = score; 





则 反 序 列 化 时 会 抛 异常 ， 提 示 找 不 到 合适 的 构造 方法 ， 可 以 使 用 
@JsonCreator 和 @Json-Property 标 记 该 构造 方法 ， 如 下 所 示 : 





@JsonCreator 

public Student( 
@JsonProperty("name") String name, 
@JsonProperty("age") int age, 
@JsonProperty("score") double score) { 


this.name = name; 
this.age = age; 
this.score = score; 


} 








这 样 ， 反 序列 化 就 没有 问题 了 。 
14.5.6 ”Jackson 对 XML 支 持 的 局 限 性 


需要 说 明 的 是 ， 对 于 XML 格 式 ，Jackson 的 支持 不 是 太 全 面 。 比 
如 ， 对 于 一 个 Map<String，List<String>> 对 象 ，Jackson 可 以 序列 化 ， 但 
不 能 反 序 列 化 ， 如 下 所 示 : 





Map<String, List<String>> map = new HashMap<>(); 
map.put("hello", Arrays.asList(new String[]{" 老 马 ", "小 马 "})); 
ObjectMapper mapper = new XmlMapper(); 
String str = mapper .writeValueAsString(map); 
System,.out.println(str); 
Map<String, List<String>> map2 = mapper.readValue(str, 

new TypeReference<Map<String, List<String>>>() {}); 
System,.out.println(map2); 





在 反 序列 化 时 ， 代 码 会 抛 出 异常 ， 如 果 mapper 是 一 个 ObjectMapper 
对 象 ， 反 序列 化 就 没有 问题 。 如 果 Jackson 不 能 满足 需求 ， 可 以 考虑 其 他 
库 ， 如 XStream (http://x-stream.github.io/ ) 。 


14.5.7 外 结 


本 节 介 绍 了 如 何 使 用 Jackson 来 实现 JSON/XML/MessagePack 序 列 
化 。 使 用 方法 是 类 似 的 ， 主 要 是 创建 的 ObjectMapper 对 象 不 一 样 ， 很 多 
情况 下 ， 不 需要 做 额外 配置 ， 但 也 有 很 多 情况 ， 需 要 做 额外 配置 ， 配 置 
方式 主要 是 注解 ， 我 们 介绍 了 Jackson 中 的 很 多 典型 注解 ， 大 部 分 注解 适 
用 于 所 有 格式 。 本 节 完 整 的 代码 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma.file.c63 
下 














Jackson 还 支持 很 多 其 他 格式 ， 如 YAML、AVRO、Protobuf、Smile 
等 。Jackson 中 也 还 有 很 多 其 他 配置 和 注解 ， 用 得 相对 较 少 ， 限 于 篇 幅 ， 
我 们 就 不 介绍 了 。 


从 注解 的 用 法 ， 我 们 可 以 看 出 ， 它 也 是 一 种 神奇 的 特性 ， 它 类 似 于 
注释 ， 但 却 能 实 实在 在 改变 程序 的 行为 ， 它 是 怎么 做 到 的 呢 ? 我 们 和 暂且 
搁置 这 个 问题 ， 留 待 到 第 22 间 介绍 。 


至 此 ， 关 于 文件 的 整个 内 容 就 介绍 完了 ， 从 下 一 章 开始 ， 让 我 们 一 
起 探索 并 发 和 线程 的 世界 ! 
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并 友 


第 15 革 并 友基 础 知识 


在 之 前 的 章节 中 ， 我 们 都 是 假设 程序 中 只 有 一 条 执行 流 ， 程 序 从 
main 方 法 的 第 一 条 语句 逐条 执行 直到 结束 。 从 本 章 开 始 ， 我 们 讨论 并 
发 ， 在 程序 中 创建 线程 来 启动 多 条 执行 流 。 并 发 和 线程 是 一 个 复杂 的 话 
题 ， 在 本 章 中 ， 我 们 讨论 关于 并 发 和 线程 的 基础 知识 ， 具 体 来 说 ， 分 为 
4 个 小 节 : 15.1 节 介绍 关于 线程 的 一 些 基本 概念 ， 15.2 节 介绍 线程 间 安 全 
竞争 同一 资源 的 机 制 ，synchronized; 15.3 节 介绍 线程 间 的 基本 协作 机 
制 : wait/notify; 15.4 节 介绍 取消 /关闭 线程 的 机 制 : 中 断 。 





15.1 线程 的 基本 概念 


本 节 ， 我 们 介绍 Java 中 线程 的 一 些 基本 概念 ， 包 括 创 建 线程 、 线 程 
的 基本 属性 和 方法 、 共 至 内 存 及 问题 、 线 程 的 优点 及 成 本 。 


15.1.1 创建 线程 





线程 表示 一 条 单独 的 执行 流 ， 它 有 自己 的 程序 执行 计数 器 ， 有 自己 
的 栈 。 下 面 ， 我 们 通过 创建 线程 来 对 线程 建立 一 个 直观 感受 。 在 Java 中 
创建 线程 有 两 种 方式 : 一 种 是 继承 Thread; 另外 一 种 是 实现 Runnable 接 
口 。 





1. 继 承 Thread 


Java 中 java.lang.Thread 这 个 类 表示 线程 ， 一 个 类 可 以 继承 Thread 并 
重 写 其 run 方 法 来 实现 一 个 线程 ， 如 下 所 示 : 





public class HelloThread extends Thread { 
@override 
public void run() { 
System.out.println("hello"); 
} 


} 





HelloThread 这 个 类 继承 了 Thread， 并 重 写 了 mn 方法 。run 方 法 的 方 
法 签名 是 固定 的 ，public， 没 有 参数 ， 没 有 返回 值 ， 不 能 抛 出 受 检 腊 
常 。run 方 法 类 似 于 单线 程 程序 中 的 main 方 法 ， 线 程 从 run 方 法 的 第 一 条 
语句 开始 执行 直到 结束 。 


定义 了 这 个 类 不 代表 代码 就 会 开始 执行 ， 线 程 需 要 被 局 动 ， 局 动 需 
要 先 创建 一 个 HelloThread 对 象 ， 然 后 调用 Thread 的 start 方 法 ， 如 下 所 
人 外: 








public static void main(String[] args) { 
Thread thread = new HelloThread(); 
thread .start() ; 

} 


我 们 在 main 方 法 中 创建 了 一 个 线程 对 象 ， 并 调用 了 其 start 方 法 ， 调 
用 start 方 法 后 ，HelloThread 的 run 方 法 就 会 开始 执行 ， 屏 幕 输 出 为 : 





hello 





为 什么 调用 的 是 start， 执 行 的 却 是 run 方 法 呢 ? start 表 示 局 动 该 线 
程 ， 使 其 成 为 一 条 单独 的 执行 流 ， 操 作 系 统 会 分 配 线程 相关 的 资源 ， 每 
个 线程 会 有 单独 的 程序 执行 计数 器 和 栈 ， 操 作 系 统 会 把 这 个 线程 作为 一 
0 分 配 时 间 扩 让 它 执行 ， 执 行 的 起 点 就 是 run 方 
法 。 


如 果 不 调用 start， 而 直接 调用 run 方 法 呢 ? 屏幕 的 输出 并 不 会 发 生变 
化 ， 但 并 不 会 局 动 一 条 单独 的 执行 流 ，run 方 法 的 代码 依然 是 在 main 线 
程 中 执行 的 ，run 方 法 只 是 main 方 法 调用 的 一 个 普通 方法 。 怎 么 确认 代 
码 是 在 哪个 线程 中 执行 的 呢 ? Thread 有 一 个 静态 方法 currentThread， 返 
回 当 前 执行 的 线程 对 象 : 





public static native Thread currentThread () ， 





每 个 Thread 都 有 一 个 id 和 name: 





public long getId() 
public final String getName() 





这 样 ， 我 们 就 可 以 判断 代码 是 在 哪个 线程 中 执行 的 。 修 改 
HelloThead 的 run 方 法 : 





Q@Override 

public void run() { 
System.out.printin("thread name: "+ Thread,.currentThread().getName()); 
System.out.printlin("hello"); 

} 








如 果 在 main 方 法 中 通过 start 方 法 启动 线程 ， 程 序 输出 为 : 





thread name: Thread-0 
hello 





如 果 在 main 方 法 中 直接 调用 run 方 法 ， 程 序 输出 为 : 





thread name: main 
hello 





调用 start 后 ， 就 有 了 两 条 执行 流 ， 新 的 一 条 执行 mn 方法 ， 旧 的 一 条 
继续 执行 main 方 法 ， 两 条 执行 流 并 发 执行 ， 操 作 系统 负责 调度 ， 在 单 
CPU 的 机 器 上 ， 同 一 时 刻 只 能 有 一 个 线程 在 执行 ， 在 多 CPU 的 机 器 上 ， 
同一 时 刻 可 以 有 多 个 线程 同时 执行 ， 但 操作 系统 给 我 们 屏蔽 了 这 种 差 
异 ， 给 程序 员 的 感觉 就 是 多 个 线程 并 发 执行 ， 但 哪 条 语句 先 执行 哪 条 后 
执行 是 不 一 定 的 。 当 所 有 线程 都 执行 完毕 的 时 候 ， 程 序 退 出 。 


2. 实 现 Runnable 接 口 


通过 继承 Thread 来 实现 线程 虽然 比较 简单 ， 但 Java 中 只 文 持 单 继 
承 ， 每 个 类 最 多 只 能 有 一 个 父 类 ， 如 果 类 已 经 有 父 类 了 ， 就 不 能 再 继承 
Thread， 这 时 ， 可 以 通过 实现 java.lang.Runnable 接 口 来 实现 线程 。 
Runnable 接 口 的 定义 很 简单 ， 只 有 一 个 ran 方法， 如 下 所 示 : 





public interface Runnable { 
public abstract void run(); 
} 





一 个 类 可 以 实现 该 接口 ， 并 实现 ran 方法， 如 下 所 示 : 





public class HelloRunnable implements Runnable { 
Q@Override 
public void run() 
System.out.printlin("hello"); 





仅仅 实现 Runnable 是 不 够 的 ， 要 启动 线程 ， 还 是 要 创建 一 个 Thread 
对 象 ， 但 传递 一 个 Runnable 对 象 ， 如 下 所 示 : 





public static void main(String[] args) { 
Thread helloThread = new Thread(new HelloRunnable()); 
helloThread. start( ); 

} 





无 论 是 通过 继承 Thead 还 是 实现 Runnable 接 口 来 创建 线程 ， 启 动 线 
程 都 是 调用 start 方 法 。 


15.1.2 ”线程 的 基本 属性 和 方法 


线程 有 一 些 基 本 属性 和 方法 ， 包 括 id、name、 优 先 级 、 状 态 、 是 否 
daemo 线 程 、sleep 方 法 、yield 方 法 、join 方 法 、 过 时 方法 等 ， 我 们 简要 


介绍 。 
1.id 和 name 

前 面 我 们 提 到 ， 每 个 线程 都 有 一 个 id 和 name。id 是 一 个 递增 的 整 
数 ， 每 创建 一 个 线程 就 加 一 。name 的 默认 值 是 Thread- 后 跟 一 个 编号 ， 
name 可 以 在 Thread 的 构造 方法 中 进行 指定 ， 也 可 以 通过 setName 方 法 进 
行 设 置 ， 给 Thread 设 置 一 个 友好 的 名 字 ， 可 以 方便 调试 。 
2. 优 先 级 


线程 有 一 个 优先 级 的 概念 ， 在 Java 中 ， 优 先 级 从 1 到 10， 默 认为 5， 
相关 方法 是 : 





public final void setPriority(int newPriority) 
public final int getPriority() 





这 个 优先 级 会 被 映射 到 操作 系统 中 线程 的 优先 级 ， 不 过 ， 因 为 操作 
系统 各 不 相同 ， 不 一 定 都 是 10 个 优先 级 ，Java 中 不 同 的 优先 级 可 能 会 被 
映射 到 操作 系统 中 相同 的 优先 级 。 必 外 ， 优 先 级 对 操作 系统 而 言 主要 是 
了 而 非 强 制 。 简 单 地 说 ， 在 编程 中 ， 不 要 过 于 依赖 优先 
级 。 


3. 状 态 


线程 有 一 个 状态 的 概念 ，Thread 有 一 个 方法 用 于 获取 线程 的 状态 : 





public State getState( ) 





返回 值 类 型 为 Thread.State， 它 是 一 个 枚 举 类 型 ， 有 如 下 值 : 





public enum State { 
NEW, 
RUNNABLE, 
BLOCKED, 
WAITING, 
TIMED_WAITING, 
TERMINATED, 





关于 这 些 状 态 ， 我 们 简单 解释 下 : 

1) NEW: 没有 调用 start 的 线程 状态 为 NEW。 

2) TERMINATED: 线程 运行 结束 后 状态 为 TERMINATED 。 

3) RUNNABLE: 调用 start 后 线程 在 执行 run 方 法 且 没 有 阻塞 时 状态 
为 RUNNABLE， 不 过 ，RUNNABLE 不 代表 CPU 一 定 在 执行 该 线程 的 代 
码 ， 可 能 正在 执行 也 可 能 在 等 待 操作 系统 分 配 时 间 片 ， 只 是 它 没 有 在 等 
待 其 他 条 件 。 


4) BLOCKED. WAITING、TIMED 都 表示 线程 被 阻 
塞 了 ， 在 等 待 一 些 条 件 ， 其 中 的 区 别 我 们 在 后 续 章 节 再 介绍 


Thread 还 有 一 个 方法 ， 返 回 线程 是 人 否 活着 : 








public final native boolean 1ISALive() 





线程 被 启动 后 ，run 方 法 运行 结束 前 ， 返 回 值 都 是 true。 
4. 是 否 daemon 线 程 


Thread 有 一 个 是 否 daemon 线 程 的 属性 ， 相 关 方法 是 : 





public final void setDaemon(boolean on) 
public final boolean isDaemon() 


前 面 我 们 提 人 到， 局 动 线程 会 局 动 一 条 单独 的 执行 流 ， 整 个 程序 只 有 
在 所 有 线程 都 结束 的 时 候 才 退出 ， 但 daemon 线 程 是 例外 ， 当 整个 程序 中 
剩 下 的 都 是 daemon 线 程 的 时 候 ， 程 序 就 会 退出 。 


daemon 线 程 有 什么 用 呢 ? 它 一 般 是 其 他 线程 的 辅助 线程 ， 在 它 辅 助 
的 主线 程 退出 的 时 候 ， 它 就 没有 存在 的 意义 了 。 在 我 们 运行 一 个 即使 最 
简单 的 "hello world" 类 型 的 程序 时 ， 实 际 上 ，Java 也 会 创建 多 个 线程 ， 除 
了 main 线 程 外 ， 至 少 还 有 一 个 负责 垃圾 回收 的 线程 ， 这 个 线程 就 是 
daemon 线 程 ， 在 main 线 程 结 束 的 时 候 ， 垃 圾 回收 线程 也 会 退出 。 


5.sleep 方 法 


Thread 有 一 个 静态 的 sleep 方 法 ， 调 用 该 方法 会 让 当前 线程 睡 虐 指 害 
的 时 间 ， 单 位 是 窜 秒 : 











public static native void sleep(long millis) throws InterruptedException; 





睡眠 期 间 ， 该 线程 会 让 出 CPU， 但 睡眠 的 时 间 不 一 定 是 确切 的 给 定 
坚 秒 数 ， 可 能 有 一 定 的 偶 差 ， 偶 差 与 系统 定时 器 和 操作 系统 调度 器 的 准 
确 度 和 精度 有 关 。 睡 眠 期 间 ， 线 程 可 以 被 中 断 ， 如 果 被 中 断 ，sleep 会 抛 
出 PnterruptedException， 关 于 中 断 以 及 中 断 处 理 ， 我 们 在 15.4 节 介绍 。 


6.yield 方 法 
Thread 还 有 一 个 让 出 CPU 的 方法 : 








public static native void yield(); 





这 也 是 一 个 静态 方法 ， 调 用 该 方法 ， 是 告诉 操作 系统 的 调度 器 : 我 
现在 不 着 急 占用 CPU， 你 可 以 先 让 其 他 线程 运行 。 不 过 ， 这 对 调度 器 也 
仪 仅 是 建议 ， 调 度 器 如 何 处 理 是 不 一 定 的 ， 它 可 能 完全 忽略 该 调用 。 
7.join 方 法 


在 前 面 HelloThread 的 例子 中 ，HelloThread 没 执行 完 ，main 线 程 可 能 


就 执行 完了 ，Thread 有 一 个 join 方 法 ， 可 以 让 调用 join 的 线程 等 待 该 线程 
结束 ，join 方 法 的 声明 为 : 





public final void join() throws InterruptedException 





在 等 待 线程 结束 的 过 程 中 ， 这 个 等 待 可 能 被 中 断 ， 如 果 被 中 断 ， 会 
抛 出 ee -Exception 。 


可 以 限定 等 待 的 最 长 时 间 ， 单 位 为 坚 秒 ， 
如 果 为 0， 表 示 无 期 限 等 











public final synchronized void join(long millis) throws InterruptedException 





在 前 面 HelloThread 示 例 中 ， 如 果 和 希望 main 线 程 在 子 线程 结束 后 再 退 
出 ，main 方 法 可 以 改 为 : 





public static void main(String[] args) throws InterruptedException { 
Thread thread = new HelloThread(); 
thread. start(); 
thread.join(); 





} 
8. 过 时 方法 


Thread 类 中 还 有 一 些 看 上 去 可 以 控制 线程 生命 周期 的 方法 ， 如 : 





public final void stop() 
public final void suspend() 
public final void resume() 








这 些 方 法 因为 各 种 原因 已 被 标记 为 了 过 时 ， 我 们 不 应 该 在 程序 中 使 
用 它们 。 








15.1.3 ”共享 内 存 及 可 能 存在 的 问题 
前 面 我 们 提 到 ， 每 个 线程 表示 一 条 单独 的 执行 流 ， 有 自己 的 程序 计 





数 器 ， 有 自己 的 栈 ， 但 线程 之 间 可 以 共享 内 存 ， 它 们 可 以 访问 和 操作 相 
同 的 对 象 。 我 们 看 个 例子 ， 如 代码 清单 15-1 所 示 。 


代码 清单 15-1 ”共享 内 存 示例 





public class ShareMemoryDemo { 
private static int shared = 0; 
private static void incrShared(){ 
Shared ++; 


static class ChildThread extends Thread { 
List<String> list; 
public ChildThread(List<String> list) { 
this.list = lJist,; 


@Override 

public void run() { 
incrShared(); 
list.add(Thread.currentThread().getName()); 


public static void main(String[] args) throws InterruptedException { 
List<String> list = new ArrayList<String>(); 
Thread t1 = new ChildThread(1ist); 
Thread t2 = new ChildThread(1ist); 
ti.start(); 
t2.start(); 
t1.join(); 
t2.join(); 
System,.out.printJln(shared ) ; 
System.out.printlin(1ist); 





在 代码 中 ， 定 义 了 一 个 静态 变量 shared 和 静态 内 部 类 ChildThread， 
在 main 方 法 中 ， 创 建 并 启动 了 两 个 ChildThread 对 象 ， 传 递 了 相同 的 list 
对 象 ，ChildThread 的 run 方 法 访问 了 共享 的 变量 shared 和 list，main 方 法 
最 后 输出 了 共享 的 shared 和 1list 的 值 ， 大 部 分 情况 下 ， 会 输出 期 望 的 值 : 








2 
[Thread-0, Thread-1] 





过 这 个 例子 ， 我 们 想 强 调 说 明 执行 流 、 内 存 和 程序 代码 之 间 的 关 


和 


1) 该 例 中 有 三 条 执行 流 ， 一 条 执行 main 方 法 ， 男 外 两 条 执行 
ChildThread 的 run 方 法 。 








2) 不 同 执行 流 可 以 访问 和 操作 相同 的 变量 ， 如 本 例 中 的 shared 和 
list 变 量 。 


3) 不 同 执行 流 可 以 执行 相同 的 程序 代码 ， 如 本 例 中 incrShared 方 
法 ，ChildThread 的 run 方 法 ， 被 两 条 ChildThread 执 行 流 执行 ，incrShared 
方法 是 在 外 部 定义 的 ， 但 被 ChildThread 的 执行 流 执行 。 在 分 析 代 码 执行 
过 程 时 ， 理 解 代码 在 被 哪个 线程 执行 是 很 重要 的 。 


4) 当 多 条 执行 流 执 行 相同 的 程序 代码 时 ， 每 条 执行 流 都 有 单独 的 
栈 ， 方 法 中 的 参数 和 局 部 变量 都 有 目 己 的 一 份 。 


当 多 条 执行 流 可 以 操作 相同 的 变量 时 ， 可 能 会 出 现 一 些 意料 之 外 的 
结果 ， 包 括 欧 态 条 件 和 内 存 可 见 性 问题 ， 我 们 来 看 下 。 


1. 竞 态 条 件 

所 谓 竞 态 条 件 〈race condition ) 是 指 ， 当 多 个 线程 访问 和 操作 同一 
个 对 象 时 ， 最 终 执行 结果 与 执行 时 序 有 关 ， 可 能 正确 也 可 能 不 正确 。 我 
们 看 一 个 例子 ， 如 代码 清单 15-2 所 示 。 


代码 清单 15-2” 竞 态 条 件 示例 
































public class CounterThread extends Thread { 
private static int counter = 0; 
Q@Override 
public void run() 
for(int i = 0; i < 1000; i++) { 
counter++; 


} 


public static void main(String[] args) throws InterruptedException { 
int num = 1000; 
Thread[] threads = new Thread[num]; 
for(int i = 0; i < num; i++) { 
threads[i] = new CounterThread(); 
threads[i].start(); 


for(int i = 0; i < num; i++) { 
threads[i].join(); 


System.out.println(counter); 





这 段 代码 容易 理解 ， 有 一 个 共享 静态 变量 counter， 初 始 值 为 0， 在 


main 方 法 中 创建 了 1000 个 线程 ， 每 个 线程 对 counter 循 环 加 1000 次 ，main 
线程 等 待 所 有 线程 结束 后 输出 counter 的 值 。 


期 望 的 结果 是 100 万 ， 但 实际 执行 ， 发 现 每 次 输出 的 结果 都 不 一 
样 ， 一 般 都 不 是 100 万 ， 经 常 是 99 万 多 。 为 什么 会 这 样 呢 ? 因为 
counter++ 这 个 操作 不 是 原子 操作 ， 它 分 为 三 个 步骤 : 

1) 取 counter 的 当前 值 ; 

2) 在 当前 值 基础 上 加 1; 

3) 将 新 值 重 新 赋值 给 counter。 

两 个 线程 可 能 同时 执行 第 一 步 ， 取 到 了 相同 的 counter 值 ， 比 如 都 取 
到 了 100， Re Nt a 而 第 二 个 线程 执行 完 后 
还 是 101， 最 终 的 结果 就 与 期 望 不 符 

怎么 解决 这 个 问题 呢 ? 有 多 种 方法 : 

:使 用 synchronized 关 键 字 ; 

.使 用 显 式 锁 ; 

.使 用 原子 变量 。 

关于 这 些 方法 ， 我 们 在 后 续 章 节 会 逐步 介绍 。 

2. 内 存 可 见 性 

多 个 线程 可 以 共享 访问 和 操作 相同 的 变量 ， 但 一 个 线程 对 一 个 共享 
变量 的 修改 ， 另 一 个 线程 不 一 定 马上 就 能 看 到 ， 甚 至 永远 也 看 不 到 。 这 
可 能 有 悖 直觉 ， 我 们 来 看 一 个 例子 ， 如 代码 清单 15-3 所 示 。 


代码 清单 15-3 ”内 存 可 见 性 示例 

















public class VisibilityDemo { 
private static boolean shutdown = false; 
static class HelloThread extends Thread { 
@Override 
public void run() { 
while(!shutdown){ 


// do nothing 


} 
System.out.printlin("exit hello"); 


public static void main(String[] args) throws InterruptedException { 
new HelloThread().start(); 
Thread.sleep(1000); 
shutdown = true; 
System.out.printin("exit main"); 
} 
} 





在 这 个 程序 中 ， 有 一 个 共享 的 boolean 变 量 shutdown， 初 始 为 false， 
HelloThread 在 shutdown 不 为 true 的 情况 下 一 直 死 循环 ， 当 shutdown 为 true 
时 退出 并 输出 "exit hello"，main 线 程 局 动 HelloThread 后 休息 了 一 会 儿 ， 
然后 设置 shutdown 为 tue， 最 后 输出 "exit main"。 


期 望 的 结果 是 两 个 线程 都 退出 ， 但 实际 执行 时 ， 很 可 能 会 发 现 
HelloThread 永 远 都 不 会 退出 ， 也 就 是 说 ， 在 HelloThread 执 行 流 看 来 ， 
shutdown 永 远 为 false， 即 使 main 线 程 已 经 更 改 为 了 true。 


这 是 怎么 回 事 呢 ? 这 就 是 内 存 可 见 性 问题 。 在 计算 机 系统 中 ， 除 

了 内 存 ， 数 据 还 会 被 缓存 在 CPU 的 寄存 器 以 及 各 级 缓存 中 ， 当 访问 一 个 
变量 时 ， 可 能 直接 从 寄存 器 或 CPU 缓存 中 获取 ， 而 不 一 定 到 内 存 中 去 

取 ， 当 修改 一 个 变量 时 ， 也 可 能 是 先 写 到 缓存 中 ， 稍 后 才 会 同步 更 新 到 
内 存 中 。 在 单线 程 的 程序 中 ， 这 一 般 不 是 问题 ， 但 在 多 线程 的 程序 中 ， 
尤其 是 在 有 多 CPU 的 情况 下 ， 这 就 是 严重 的 问题 。 一 个 线程 对 内 存 的 修 
改 ， 男 一 个 线程 看 不 到 ， 一 是 修改 没有 及 时 同步 到 内 存 ， 二 是 为 一 个 线 
程 根本 束 没 从 内 存 读 。 


怎么 解决 这 个 问题 呢 ? 有 多 种 方法 : 
.使 用 volatile 关 键 字 。 
.使 用 synchronized 关 键 字 或 显 式 锁 同 步 。 


关于 这 些 方法 ， 我 们 在 后 续 章 节 会 逐步 介绍 。 

















15.1.4 ”线程 的 优点 及 成 本 


5000 
ls 


1) 充分 利用 多 CPU 的 计算 能 力 ， 单 线程 只 能 利用 一 个 CPU， 使 用 
多 线程 可 以 利用 多 CPU 的 计算 能 


2) 充分 利用 硬件 资源 ，CPU 和 和 硬盘、 网络 是 可 以 同时 工作 的 ， 一 
个 线程 在 等 待 网 络 IO 的 同时 ， 男 一 个 线程 完全 可 以 利用 CPU， 对 于 多 个 
独立 的 网 络 请 求 ， 完 全 可 以 使 用 多 个 线程 同时 请 求 。 


3) 在 用 户 界面 《GUI) 应 用 程序 中 ， 保 持 程序 的 啊 应 性 ， 界 面 和 
后 台 任 务 通常 是 不 同 的 线程 ， 否 则 ， 如 果 所 有 事情 都 是 一 个 线程 来 执 
ee 


4) 简化 建 模 及 IO 处 理 ， 比 如 ， 在 服务 器 应 用 程序 中 ， 对 每 个 用 户 
请 求 使 用 一 个 单独 的 线程 进行 处 理 ， 相 比 使 用 一 个 线程 ， 处 理 来 目 各 种 
en 
得 多 。 


关于 线程 ， 我 们 需要 知道 ， 它 是 有 成 本 的 。 创 建 线程 需要 消耗 操作 
系统 的 资源 ， 操 作 系统 会 为 每 个 线程 创建 必要 的 数据 结构 、 栈 、 程 序 计 
数 吉 等， 创建 也 需要 一 定 的 时 间 。 


此 外 ， 线 程 调度 和 切换 也 是 有 成 本 的 ， 当 有 大 量 可 运行 线程 的 时 
候 ， 操 作 系 统 会 忙于 调度 ， 为 一 个 线程 分 配 一 段 时 间 ， 执 行 完 后 ， 再 让 
为 一 个 线程 执行 ， 一 个 线程 被 切换 出 去 后 ， 操 作 系 统 需要 保存 它 的 当前 
上 上 下文 状态 到 内 存 ， 上 下 文 状态 包括 当前 CPU 寄 存 占 的 值 、 程 序 计数 器 
的 值 等 ， 而 一 个 线程 被 切换 回来 后 ， 操 作 系 统 需 要 恢复 它 原 来 的 上 下 文 
状态 ， 整 个 过 程 称 为 上 下 文 切换 ， 这 个 切换 不 仅 耗 时 ， 而 且 使 CPU 中 的 
很 多 缓存 失效 。 


当然 ， 这 些 成 本 是 相对 而 言 的 ， 如 果 线 程 中 实际 执行 的 事情 比较 
多 ， 这 些 成 本 是 可 以 接受 的 ; 但 如 果 只 是 执行 本 节 示 例 中 的 counter++， 
那 相 对 成 本 就 太 高 了 。 


另外 ， 如 果 执 行 的 任务 都 是 CPU 密集 型 的 ， 即 主要 消耗 的 都 是 
CPU， 那 创建 超过 CPU 数量 的 线程 就 是 没有 必要 的 ， 并 不 会 加 快 程序 的 
































执行 。 


15.2 ”理解 Synchronized 


上 一 节 ， 我 们 提 到 ， 共 享 内 存 有 两 个 重要 问题 ， 一 个 是 苋 态 条 件 ， 
另 一 个 是 内 存 可 见 性 ， 解 决 这 两 个 问题 的 一 个 方案 是 使 用 synchronized 
关键 字 ， 本 节 束 来 讨论 这 个 关键 字 。 我 们 先 来 了 解 synchronized 的 用 法 
和 基本 原理 ， 然 后 再 从 多 个 角度 进一步 理解 ， 最 后 介绍 使 用 
synchronized 实 现 的 同步 容器 及 其 注意 事项 。 


15.2.1 用 法 和 基本 原理 


synchronized 可 以 用 于 修饰 类 的 实例 方法 、 静 态 方法 和 代码 块 ， 我 
们 分 别 介绍 。 
1. 实 例 方 法 

上 节 我 们 介绍 了 一 个 计数 的 例子 ， 当 多 个 线程 并 发 执行 counter++ 的 
时 候 ， 由 于 该 语句 不 是 原子 操作 ， 出 现 了 意料 之 外 的 结果 ， 这 个 问题 可 
以 用 synchronized 解 决 ， 如 代码 清单 15-4 所 示 。 


代码 清单 15-4 ”用 synchronized 修 饰 的 Counter 类 








public class Counter { 

private int count; 

public synchronized void incr(){ 
count ++; 

} 

public synchronized int getCount() { 
return count; 

} 


} 





Counter 是 一 个 简单 的 计数 器 类 ，incr 方 法 和 getCount 方 法 都 加 了 
synchronized 修 饰 。 加 了 synchronized 后 ， 方 法 内 的 代码 就 变 成 了 原子 操 
作 ， 当 多 个 线程 并 发 更 新 同一 个 Counter 对 象 的 时 候 ， 也 不 会 出 现 问 
题 。 使 用 的 代码 如 代码 清单 15-5 所 示 。 


代码 清单 15-5 ”多 线程 访问 synchronized 保 护 的 Counter 对 象 





有 


public class CounterThread extends Thread { 
Counter counter ; 
public CounterThread(Counter counter ) { 
this.counter = counter ， 


Q@Override 
public void run() { 
for(int i = 0; i < 1000; i++) { 
counter .incr(); 


public static void main(String[] args) throws InterruptedException { 
int num = 1000; 
Counter counter = new Counter(); 
Thread[] threads = new Thread[num]; 
for(int i = 0; i < num; i++) { 
threads[i] = new CounterThread(counter); 
threads[i].start(); 


for (int i = 0; i < num; i++) { 
threads[i].join(); 


System.out.printJln(counter .getCount( ) ) ， 





与 上 节 类 似 ， 我 们 创建 了 1000 个 线程 ， 传 递 了 相同 的 counter 对 象 ， 
每 个 线程 主要 就 是 调用 Counter 的 incr 方 法 1000 次 ，main 线 程 等 待 子 线程 
结束 后 输出 counter 的 值 ， 这 次 ， 不 论 运 行 多 少 次 ， 结 果 都 是 正确 的 100 
Hs 


这 里 ，synchronized 到 底 做 了 什么 呢 ? 看 上 去 ，synchronized 使 得 同 
时 只 能 有 一 个 线程 执行 实例 方法 ， 但 这 个 理解 是 不 确切 的 。 多 个 线程 是 
可 以 同时 执行 同一 个 synchronized 实 例 方法 的 ， 只 要 它们 访问 的 对 象 是 
不 同 的 即 可 ， 比如 : 





Counter counter1 = new Counter(); 
Counter counter2 = new Counter(); 

Thread t1 = new CounterThread(counter1); 
Thread t2 = new CounterThread(counter2); 
t1.start(); 

t2.start(); 





这 里 ，t1 和 t2 两 个 线程 是 可 以 同时 执行 Counter 的 incr 方 法 的 ， 因 为 
它们 访问 的 是 不 同 的 Counter 对 象 ， 一 个 是 counter1， 男 一 个 是 
COUnter2 。 


所 以 ，synchronized 实 例 方法 实际 保护 的 是 同一 个 对 象 的 方法 调 
用 ， 确保 同 时 只 能 有 一 个 线程 执行 。 再 具体 来 说 ，synchronized 实 例 方 
法 保护 的 是 当前 实例 对 象 ， 即 this，this 对 象 有 一 个 锁 和 一 个 等 待 队 列 ， 
锁 只 能 被 一 个 线程 持 有 ， 其 他 试图 获得 同样 锁 的 线程 需要 等 待 。 执 行 
synchronized 实 例 方法 的 过 程 大 致 如 下 : 


1) 尝试 获得 锁 ， 如 果 能 够 获得 锁 ， 继 续 下 一 步 ， 否 则 加 入 等 待 队 
列 ， 阻 塞 并 等 待 唤醒 。 


2) 执行 实例 方法 体 代码 。 


3) 释放 锁 ， 如 果 等 待 队列 上 有 等 竺 的 线程 ， 从 中 取 一 个 并 唤醒 ， 
如 果 有 多 个 等 待 的 线程 ， 唤 醒 哪 一 个 是 不 一 定 的 ， 不 保证 公平 性 。 


synchronized 的 实际 执行 过 程 比 这 要 复杂 得 多 ， 而 且 Java 虚 拟 机 采用 
了 多 种 优化 方式 以 提高 性 能 ， 但 从 概念 上 上， 我们 可 以 这 么 简单 理解 。 


当前 线程 不 能 获得 锁 的 时 候 ， 它 会 加 入 等 待 队列 等 待 ， 线 程 的 状态 
会 变 为 BLOCKED。 


我 们 再 强调 下 ，synchronized 保 护 的 是 对 象 而 非 代 码 ， 只 要 访问 的 
是 同一 个 对 象 的 Synchronized 方 法 ， 即 使 是 不 同 的 代码 ， 也 会 被 同步 顺 
序 访问 。 比如 ， 对 于 Counter 中 的 两 个 实例 方法 getCount 和 incr， 对 同一 
个 Counter 对 象 ， 一 个 线程 执行 getCount， 男 一 个 执行 incr， 它 们 是 不 能 
同时 执行 的 ， 会 被 synchronized 同 步 顺 序 执行 。 


此 外 ， 需 要 说 明 的 是 ，synchronized 方 法 不 能 防止 非 synchronized 方 
法 被 同时 执行 。 比 如 ， 如 果 给 Counter 类 增加 一 个 非 synchronized 方 法 : 























public void decr(){ 
count --; 
} 





则 该 方法 可 以 和 synchronized 的 incr 方 法 同时 执行 ， 这 通常 会 出 现 非 
期 望 的 结果 ， 所 以 ， 一 般 在 保护 变量 时 ， 需 要 在 所 有 访问 该 变量 的 方法 
上 加 上 synchronized。 


2. 静 态 方法 








synchronized 同 样 可 以 用 于 静态 方法 ， 如 代码 清单 15-6 所 示 。 


代码 清单 15-6 ”synchronized 修 饰 静态 方法 





public class StaticCounter { 
private static int count = 0; 
public static synchronized void incr() { 
count++; 
} 


public static synchronized int getCount() { 
return count; 
} 
} 





前 面 我 们 说 ，synchronized 保 护 的 是 对 象 ， 对 实例 方法 ， 保 护 的 是 
当前 实例 对 象 this， 对 静态 方法 ， 保 护 的 是 哪个 对 象 呢 ? 是 类 对 象 ， 这 
里 是 StaticCounter.class。 实 际 上 ， 每 个 对 象 都 有 一 个 锁 和 一 个 等 待 队 
列 ， 类 对 象 也 不 例外 。 


synchronized 静 态 方法 和 synchronized 实 例 方法 保护 的 是 不 同 的 对 
象 ， 不 同 的 两 个 线程 ， 可 以 一 个 执行 synchronized 静 态 方 法 ， 另 一 个 执 
行 synchronized 实 例 方法 。 
3. 代 码 块 


除了 用 于 修饰 方法 外 ，synchronized 还 可 以 用 于 包装 代码 块 ， 比 如 
对 于 代码 清单 15-4 的 Counter 类 ， 等 价 的 代码 如 代码 清单 15-7 所 示 。 


代码 清单 15-7 ”synchronized 代 码 块 修饰 的 Counter 类 








public class Counter { 
private int count; 
public void incr(){ 


Synchronized(this){ 
COunt ++; 
} 
public int getCount() { 
Synchronized(this){ 
return count ， 
} 
} 


== 





Synchronized 括 号 里 面 的 就 是 保护 的 对 象 ， 对 于 实例 方法 ， 融 是 
this，{} 里 面 是 同步 执行 的 代码 。 对 于 前 面 的 StaticCounter 类 ， 等 价 的 代 
码 如 代码 清单 15-8 所 示 。 


代码 清单 15-8 synchronized 代 码 块 修饰 的 StaticCounter 类 





public class StaticCounter { 
private static int count = 0; 
public static void incr() { 
synchronized(StaticCounter.class){ 
count++; 


} 


public static int getCount() { 
Synchronized(StaticCounter ,class){ 
return count 
} 
} 
} 





synchronized 同 步 的 对 象 可 以 是 任意 对 象 ， 任 意 对 象 都 有 一 个 锁 和 
等 待 队 列 ， 或 者 说 ， 任 何 对 象 都 可 以 作为 锁 对 象 。 比 如 ，Counter 类 的 
等 价 代 码 还 可 以 如 代码 清单 15-9 所 示 。 


代码 清单 15-9 ”使 用 单独 对 象 作 为 锁 的 Counter 类 





public class Counter { 
private int count ， 
private Object lock = new Object(); 
public void incr(){ 
Synchronized(1Lock){ 
count ++; 


} 
public int getCount() { 
Synchronized(1Lock){ 
return Count 
} 


} 
} 





15.2.2 ”进一步 理解 synchronized 


介绍 了 synchronized 的 基本 用 法 和 原理 之 后 ， 我 们 再 从 下 面 几 个 角 
度 来 进一步 介绍 syn-chronized: 


:可 重 入 性 。 
内存 可 见 性 。 
` 死 锁 。 

1. 可 重 入 性 


synchronized 有 一 个 重要 的 特征 ， 它 是 可 重 入 的 ， 也 就 是 说 ， 对 同 
一 个 执行 线程 ， 它 在 获得 了 锁 之 后 ， 在 调用 其 他 需要 同样 锁 的 代码 时 ， 
可 以 直接 调用 。 比 如 ， 在 一 个 syn-chronized 实 例 方法 内 ， 可 以 直接 调用 
其 他 synchronized 实 例 方 法 。 可 重 入 是 一 个 非常 自然 的 属性 ， 应 该 是 很 
容易 理解 的 ， 之 所 以 强调 ， 是 因为 并 不 是 所 有 锁 都 是 可 重 入 的 ， 后 续 章 
节 我 们 会 看 到 不 可 重 入 的 锁 。 


可 重 入 是 通过 记录 锁 的 持 有 线程 和 持 有 数量 来 实现 的 ， 当 调用 被 
synchronized 保 护 的 代码 时 ， 检 查 对 象 是 否 已 被 锁 ， 如 果 是 ， 再 检查 是 
售 被 当前 线程 锁定 ， 如 果 是 ， 增 加 持 有 数量 ， 如 果 不 是 被 当前 线程 锁 
定 ， 才 加 入 等 竺 队列 ， 当 释放 锁 时 ， 减 少 持 有 数量 ， 当 数量 变 为 0 时 才 
释放 整个 锁 。 

2. 内 存 可 见 性 

对 于 复杂 一 些 的 操作 ，synchronized 可 以 实现 原子 操作 ， 避 免 出 现 

竞 态 条 件 ， 但 对 于 明显 的 本 来 就 是 原子 的 操作 方法 ， 也 需要 加 


Synchronized 吗 ? 比如 ， 下 面 的 开关 类 Switcher 只 有 一 个 boolean 变 量 on 和 
对 应 的 setter/getter 方 法 : 











public class Switcher { 
private boolean on; 
public boolean isOn() { 
return on; 


} 
public void setOon(boolean on) { 
this.on = on 
} 
} 





当 多 线程 同时 访问 同一 个 Switcher 对 象 时 ， 会 有 问题 吗 ? 没有 竞 态 
条 件 问题 ， 但 正如 上 节 所 说 ， 有 内 存 可 见 性 问题 ， 而 加 上 synchronized 





可 以 解决 这 个 问题 。 


synchronized 除 了 保证 原子 操作 外 ， 它 还 有 一 个 重要 的 作用 ， 就 是 
保证 内 存 可 见 性 ， 在 杰 放 锁 时 ， 所 有 写 入 都 会 写 回 内 存 ， 而 获得 锁 
后 ， 都 会 从 内 存 中 读 最 新 数据 。 


不 过 ， 如 果 只 是 为 了 保证 内 存 可 见 性 ， 使 用 synchronized 的 成 本 有 
点 高 ， 有 一 个 更 轻 量 级 的 方式 ， 那 就 是 给 变量 加 修饰 符 volatile， 如 下 
所 示 : 








public class Switcher { 
private volatile boolean on,; 
public boolean isOn() { 
return on; 


public void setOon(boolean on) { 
this.on = on; 
} 
} 








加 了 volatile 之 后 ，Java 会 在 操作 对 应 变量 时 插入 特殊 的 指令 ， 保 证 
读 写 到 内 存 最 新 值 ， 而 非 绥 存 的 值 。 


3. 死 锁 

使 用 synchronized 或 者 其 他 锁 ， 要 注意 死 锁 。 所 谓 死 锁 就 是 类 似 这 
种 现象 ， 比 如 ， 有 a、Pb 两 个 线程 ，a 持 有 锁 A， 在 等 待 锁 B， 而 b 持 有 锁 
B， 在 等 待 锁 A，a 和 b 陷 入 了 互相 等 待 ， 最 后 谁 都 执行 不 下 去 ， 如 代码 
清单 15-10 所 示 。 


代码 清单 15-10 “ 死 锁 示例 





public class DeadLockDemo { 
private static Object lockA = new Object() 
private static Object lockB = new Object() 
private static void startThreadA() { 
Thread aThread = new Thread() { 
@Override 
public void run() { 
synchronized (lockA) { 
try { 
Thread. sleep(1000); 
} catch (InterruptedException e) { 


synchronized (lockB) { 


} 
} 
} 


}; 
aThread. start(); 


private static void startThreadB() { 
Thread bThread = new Thread() { 
@Override 
public void run 
synchronized (lockB) { 
try { 
Thread. sleep(1000); 
} catch (InterruptedException e) { 
} 


synchronized (lockA) { 


} 
} 


}; 
bThread. start(); 


public static void main(String[] args) { 
startThreadA( ); 
startThreadB(); 
} 
} 





运行 后 aThread 和 bThread 陷 入 了 相互 等 待 。 怎 么 解决 昵 ? 首先 ， 应 
该 尽量 避免 在 持 有 一 个 锁 的 同时 去 申请 另 一 个 锁 ， 如 果 确 实 需要 多 个 
锁 ， 所 有 代码 都 应 该 按照 相同 的 顺序 去 申请 锁 。 比如 ， 对 于 上 面 的 例 
子 ， 可 以 约定 都 先 申 请 lockA， 再 申请 lockB。 


不 过 ， 在 复杂 的 项 目 代码 中 ， 这 种 约定 可 能 难以 做 到 。 还 有 一 种 方 
法 是 使 用 后 续 章 节 介绍 的 显 式 锁 接口 Lock， 它 支持 尝试 获取 锁 
(tryLock) 和 带 时 间 限 制 的 获取 锁 方法 ， 使 用 这 些 方法 可 以 在 获取 不 到 
绩 的 时 候 释放 已经 持 有 的 镇， 然后 再 次 尝试 获取 锁 束 二 及 放弃 ， 以 站 免 
:人 o 


如 果 还 是 出 现 了 死 锁 ， 怎 么 办 呢 ? Java 不 会 主动 处 理 ， 不 过 ， 借 助 
一 些 工 具 ， 我 们 可 以 发 现 运行 中 的 死 锁 ， 比 如 ，Java 目 带 的 jstack 命 令 会 
报告 发 现 的 死 锁 。 对 于 上 面 的 程序 ， 在 笔者 的 计算 机 中 ，jstack 会 生成 
图 15-1 所 示 的 报告 。 








15.2.3 ”同步 容 絮 及 其 注意 事项 


我 们 知道 ， 类 Collection 中 有 一 些 方法 ， 可 以 返回 线程 安全 的 同步 容 


名 ， 比如 : 





public static <T> Collection<T> synchronizedCollection(Collection<T> c) 
public static <T> List<T> synchronizedList(List<T> list) 
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) 


Found one Java-level deadlock: 


"Thread-1"; 
waiting to Lock monitor 0x00007ff95102d368 (object 0x00000007d56693f0，a java.lang.0bject), 
which is held by "Thread-0" 

"Thread-0": 
waiting to lock monitor 0x90007ff95102e758 (object 90x00000007d5669400，a java.lang.0bject), 
which is held by "Thread-1" 


Java stack information for the threads listed above: 


"Thread-1": 
at shuo.laoma.concurrent.c66.DeadLockDemo$2.run(DeadLockDemo. java:34) 
- waiting to lock <0x00000007d56693f0> (a java.lang.0bject) 
— locked <0x00000007d5669400> (a java.lang.0bject) 

"Thread-0": 
at shuo.laoma.concurrent.c66.DeadLockDemo$1.run(DeadLockDemo. java:17) 
- waiting to Lock <0x00000007d5669400> (a java.lang.0bject) 
- locked <0x00000007d56693f0> (a java.lang.0bject) 


Found 1 deadlock. 





图 15-1 jstack 的 死 锁 检 测 


它们 是 给 所 有 容器 方法 都 加 上 synchronized 来 实现 安全 的 ， 比 如 
Synchronized-Collection， 其 部 分 代码 如 下 所 示 : 





static class SynchronizedCollection<E> implements Collection<E> { 
final Collection<E> c; //Backing Collection 


final Object mutex; //Object on which to synchronize 
SynchronizedCollection(Collection<E> c) { 
if(c==nul]l) 


throw new NullPointerException(); 
this.c = c; 
mutex = this; 
} 
public int size() { 
synchronized (mutex) {return c.size();} 


} 
public boolean add(E e) { 
synchronized (mutex) {return c.add(e);} 


public boolean remove(Object o) { 
synchronized (mutex) {return c.remove(o);} 
} 


/hs 





这 里 线程 安全 针对 的 是 容 圳 对象 ， 指 的 是 当 多 个 线程 并 发 访问 同一 
个 容器 对 象 时 ， 不 需要 额外 的 同步 操作 ， 也 不 会 出 现 错误 的 结 


加 了 synchronized， 上 所 有 方法 调用 变 成 了 原子 操作 ， 客 户 端 在 调用 
时 ， 是 不 是 就 绝对 安全 了 呢 ? 不 是 的 ， 至 少 有 以 下 情况 需要 注意 : 


.复合 操作 ， 比 如 先 检查 再 更 新 。 
- 伪 同 步 。 
人 
我 们 分 别 介绍 。 
1. 复 合 操作 
先 来 看 复合 操作 ， 我 们 看 段 代 码 : 














public class EnhancedMap <K, V> { 
Map<K, V> map ， 
public EnhancedMap(Map<K,V> map){ 
this.map = Collections,SsynchronizedMap(map ) ; 


} 
public V putIfAbsent(K key, V value){ 
V old = map.get(key); 
if(old!=null){ 
return old; 
return map.put(key, value); 


} 
public V put(K key, V value){ 
return map.put(key, value); 
} 


A Ass 





EnhancedMap 是 一 个 装饰 类 ， 接 受 一 个 Map 对 象 ， 调 用 
synchronizedMap 转 换 为 了 同步 容器 对 象 map， 增 加 了 一 个 方法 
putIfAbsent， 该 方法 只 有 在 原 Map 中 没有 对 应 键 的 时 候 才 添加 (在 Java 8 
之 后 ，Map 接 口 增加 了 putIfAbsent 默 认 方 法 ， 这 是 针对 Java 8 之 前 的 Map 
接口 演示 概念 ) 。 


map 的 每 个 方法 都 是 安全 的 ， 但 这 个 复合 方法 putIfAbsent 是 安全 的 
吗 ? 显然 是 否定 的 ， 这 是 一 个 检查 然后 再 更 新 的 复合 操作 ， 在 多 线程 的 














情况 下 ， 可 能 有 多 个 线程 都 执行 完了 检查 这 一 步 ， 都 发 现 Map 中 没有 对 
应 的 键 ， 然 后 就 会 都 调用 put， 这 就 破坏 了 putIf-Absent 方 法 期 望 保 持 的 
放流 。 

2. 伪 同步 


那 给 该 方法 加 上 synchronized 束 能 实现 安全 吗 ? 如 下 所 示 : 





public synchronized V putIfAbsent(K key, V value)t{ 
V old = map.get(key); 
if(old!=null){ 
return old; 


return map.put(key, value); 





答案 是 否定 的 ! 为 什么 呢 ? 同步 错 对 象 了 。 putlfAbsent 同 步 使 用 的 
是 EnhancedMap 对 象 ， 而 其 他 方法 (如 代码 中 的 put 方 法 ) 使 用 的 是 
Collections.SynchronizedMap 返 回 的 对 象 map， 两 者 是 不 同 的 对 象 。 要 解 
决 这 个 问题 ， 所 有 方法 必须 使 用 相同 的 锁 ， 可 以 使 用 EnhancedMap 的 对 
象 锁 ， 也 可 以 使 用 map。 使 用 EnhancedMap 对 象 作 为 锁 ， 则 Enhanced- 
Map 中 的 所 有 方法 都 需要 加 上 synchronized。 使 用 map 作 为 锁 ， 
putIfAbsent 方 法 可 以 改 为 : 





public V putIfAbsent(K key, V value){ 
synchronized(map)t 
V old = map.get(key); 
if(old!=null1){ 
return old; 


return map.put(key, value); 





3 过 代 

对 于 同步 容器 对 象 ， 虽 然 单个 操作 是 安全 的 ， 但 迭代 并 不 是 。 我 们 
看 个 例子 ， 创 建 一 个 同步 List 对 象 ， 一 个 线程 修改 List， 另 一 个 壳 历 ， 看 
看 会 发 生 什么 ， 如 代码 清单 15-11 所 示 。 


代码 清单 15-11 同步 容 需 欠 代 问题 





private static void startModifyThread(final List<String> list) { 
Thread modifyThread = new Thread(new Runnable() { 
@Override 
public void run() { 
for(int i = 0; i < 100; i++) { 
list.add("item " + i); 
try { 
Thread.sleep((int) (Math.random() * 10)); 
} catch (InterruptedException e) { 


} 


} 
}); 
modifyThread. start( ); 
} 
private static void startIteratorThread(final List<String> list) { 
Thread iteratorThread = new Thread(new Runnable() { 
@Override 
public void run() { 
while (true) { 
for(String Str : list) { 


} 
}); 


iteratorThread. start(); 


public static void main(String[] args) { 
final List<String> list = Collections 
.SynchronizedList(new ArrayList<String>()); 
startIteratorThread(1ist); 
startModifyThread(1ist); 





运行 该 程序 ， 程 序 抛 出 并 发 修改 异常: 





Exception in thread "Thread-0" java.util.ConcurrentModificationException 
at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:859) 
at java.util.ArrayList$Itr.next(ArrayList.java:831) 





我 们 之 前 介绍 过 这 个 异常 ， 如 果 在 亿 历 的 同时 容器 发 生 了 结构 性 变 
化 ， 束 会 抛 出 该 异常 。 同 步 容 器 并 没有 解决 这 个 问题 ， 如 果 要 避免 这 个 
异常 ， 需 要 在 裔 历 的 时 候 给 整个 容器 对 象 加 锁 。 比如 ， 上 面 的 代码 
startIteratorThread 可 以 改 为 : 








private static void startIteratorThread(final List<String> list) { 
Thread iteratorThread = new Thread(new Runnable() { 
@Override 
public void run() { 
while(true) { 
Synchronized(1ist){ 
for(String str : list) { 


} 
} 
} 


/ 
IteratorThread ,start(); 


} 





4. 并 发 容器 


除了 以 上 这 些 注 意 事项 ， 同 步 容 器 的 性 能 也 是 比较 低 的 ， 当 并 发 访 
问 量 比较 大 的 时 候 性 能 比较 差 。 所 六 的 是 ，Java 中 还 有 很 多 专 为 并 及 设 
计 的 容器 类 ， 比 如 : 





‘CopyOnWriteArrayList。 
‘ConcurrentHashMap。 
‘ConcurrentLinkedQueue。 
‘ConcurrentSkipListSet。. 


这 些 容 器 类 都 是 线程 安全 的 ， 但 都 没有 使 用 synchronized， 没 有 达 
代 问 题 ， 直 接 文 持 一 些 复合 操作 ， 人 性 能 也 高 得 多 ， 它 们 能 解决 什么 问 
题 ? 怎 么 使 用 ? 实现 原理 是 什么 ? 我 们 后 续 和 音节 介绍 。 


至 此 ， 关 于 synchronized 就 介绍 完了 。 本 节 详 细 介 绍 了 synchronized 
的 用 法 和 实现 原理 ， 为 进一步 理解 synchronized， 介 绍 了 可 重 入 性 、 内 
存 可 见 性 、 死 锁 等 ， 最 后 ， 介 绍 了 同步 容器 及 其 注意 事项 ， 如 复合 操 
作 、 伪 同步 、 和 迭代 异常 、 并 发 容器 等 。 





15.3 ”线程 的 基本 协作 机 制 


多 线程 之 间 除 了 竞争 访问 同一 个 资源 外 ， 也 经 间 需 要 相互 协作 ， 怎 
么 协作 呢 ? 本 节 就 来 介绍 Java 中 多 线程 协作 的 基本 机 制 waitnotify。 


都 有 哪些 场景 需要 协作 ?wait/notify 是 什么 ”如 何 使 用 ? 实现 原理 
是 什么 ? 协作 的 核心 是 什么 ”如 何 实现 各 种 典型 的 协作 场景 ? 本 节 进 行 
详细 讨论 ， 我 们 先 来 看 看 都 有 哪些 协作 的 场景 。 











15.3.1 协作 的 场景 


多 线程 之 间 需 要 协作 的 场景 有 很 多 ， 比 如 : 


1) 生产 者 /消费 者 协作 模式 : 这 是 一 种 常见 的 协作 模式 ， 生 产 者 线 
程 和 消费 者 线程 通过 共 宇 队列 进行 协作 ， 生 产 者 将 数据 或 任务 放 到 队列 
上 ， 而 消费 者 从 队列 上 取 数 据 或 任务 ， 如 果 队 列 长 度 有 限 ， 在 队列 满 的 
时 候 ， 生 产 者 需要 等 待 ， 而 在 队列 为 空 的 时 候 ， 消 费 者 需要 等 符 。 


2) 同时 开始 : 类 似 运 动员 比赛 ， 在 听 到 比赛 开始 枪 啊 后 同时 开 
始 ， 在 一 些 程序 ， 尤 其 是 模拟 仿真 程序 中 ， 要 求 多 个 线程 能 同时 开始 。 


3) 等 待 结束: 主 从 协作 模式 也 是 一 种 常见 的 协作 模式 ， 主 线程 将 
任务 分 解 为 耕 干 子 任务 ， 为 每 个 子 任务 创建 一 个 线程 ， 主 线程 在 继续 执 
行 其 他 任务 之 前 需要 等 竺 每 个 子 任务 执行 完毕 。 


4) 异步 结果 : 在 主 从 协作 模式 中 ， 主 线程 手工 创建 子 线程 的 写法 
往往 比较 麻烦 ， 一 种 常见 的 模式 是 将 子 线程 的 管理 封装 为 异步 调用 ， 寞 
步调 用 马上 返回 ， 但 返回 的 不 是 最 终 的 结果 ， 而 是 一 个 一 般 称 为 Future 
的 对 象 ， 通 过 它 可 以 在 随后 获得 最 终 的 结 


5) 集合 点 : 类 似 于 学 校 或 公司 组 团 旅游 ， 在 旅游 过 程 中 有 知 干 集 
合 点 ， 比 如 出 发 集合 点 ， 每 个 人 从 不 同 地 方 来 到 集合 点 ， 所 有 人 到 章 后 
进行 下 一 项 活动 ， 在 一 些 程序 ， 比 如 并 行 迭 代 计 算 中 ， 每 个 线程 负责 一 
部 分 计算 ， 然 后 在 集合 点 等 待 其 他 线程 完成 ， 所 有 线程 到 齐 后 ， 交 换 数 
据 和 计算 结果 ， 再 进行 下 一 次 友 代 。 
































我 们 会 探讨 如 何 实现 这 些 协作 场景 ， 在 此 之 前 ， 我 们 先 来 了 解 协 作 
的 基本 方法 wait/notify。 


15.3.2 wait/notify 


我 们 知道 ，Java 的 根 父 类 是 Object，Java 在 Object 类 而 非 Thread 类 中 
定义 了 一 些 线程 协作 的 基本 方法 ， 使 得 每 个 对 象 都 可 以 调用 这 些 方法 ， 


这 些 方法 有 两 类 ， 一 类 是 wait， 另 一 类 是 notify。 


主要 有 两 个 wait 方 法 : 








public final void wait() throws InterruptedException 
public final native void wait(long timeout) throws InterruptedException; 








一 个 市 时 间 参 数 ， 单 位 是 室 秒 ， 表 示 最 多 等 待 这 么 长 时 间 ， 参 数 为 
0 表示 无 限期 等 待 ， 一 个 不 市 时 间 参 数 ， 表 示 无 限期 等 每 ， 实 际 就 是 调 
用 wait (0) 。 在 等 待 期 间 都 可 以 被 中 断 ， 如 有 果 补 中断 ， 会 抛 出 
InterruptedException。 关 于 中 断 及 中 断 处 理 ， 我 们 在 下 节 介 绍 ， 本 市 暂 
时 忽略 该 异常 。 


wait 实 际 上 做 了 什么 昵 ?” 它 在 等 竺 什么 ?上 市 我 们 说 过 ， 每 个 对 象 
都 有 一 把 锁 和 等 竺 队列， 一 个 线程 在 进入 synchronized 代 码 块 时 ， 会 尝 
试 获 取 锁 ， 如 果 获 取 不 到 则 会 把 当前 线程 加 入 等 待 队 列 中 ， 其 实 ， 除 了 
用 于 锁 的 等 待 队 列 ， 每 个 对 象 还 有 男 一 个 等 待 队 列 ， 表 示 条 件 队 列 ， 该 
队列 用 于 线程 间 的 协作 。 调用 wait 就 会 把 当前 线程 放 到 条 件 队 列 上 并 阻 
塞 ， 表 示 当 前 线程 执行 不 下 去 了 ， 它 需要 等 待 一 个 条 件 ， 这 个 条 件 它 自 
己 改 变 不 了 ， 需 要 其 他 线程 改变 。 当 其 他 线程 改变 了 条 件 后 ， 应 该 调用 
Object 的 notify 方 法 : 














public final native void notify(); 
public final native void notifyAll(); 





notify 做 的 事情 就 是 从 条 件 队 列 中 选 一 个 线程 ， 将 其 从 队列 中 移 除 
notifyAll 和 notify 的 区 别 是 ， 它 会 移 除 条 件 队列 中 所 有 的 线程 并 
部 唤醒 。 


我 们 来 看 个 简单 的 例子 ， 一 个 线程 局 动 后 ， 在 执行 一 项 操作 前 ， 它 
需要 等 竺 主线 程 给 它 指令 ， 收 到 指令 后 才 执行 ， 如 代码 清单 15-12 所 
NE 


~ 


代码 清单 15-12 ”简单 协作 示例 WaitThread 





public class WaitThread extends Thread { 

private volatile boolean fire = false; 
Q@Override 
public void run() { 

try { 

synchronized (this) { 
while(!fire) { 
wait(); 


System.out.printin("fired"); 
} catch(InterruptedException e) { 


public synchronized void fire() { 
this.fire = true; 
notify(); 


public static void main(String[] args) throws InterruptedException { 
WaitThread waitThread = new WaitThread( ); 
waitThread,.start(); 
Thread. sleep(1000); 
System.out.printJln("fire")， 
waitThread.fire( ); 





示例 代码 中 有 两 个 线程 ， 一 个 是 主线 程 ， 一 个 是 WaitThread， 协 作 
的 条 件 变 量 是 fire，WaitThread 等 待 该 变量 变 为 true， 在 不 为 true 的 时 候 
调用 wait， 主 线程 设置 该 变量 并 调用 notify。 


两 个 线程 都 要 访问 协作 的 变量 fire， 容 易 出 现 竞 态 条 件 ， 所 以 相关 
代码 都 需要 被 synchronized 保 护 。 实 际 上 ，wait/notify 方 法 只 能 在 
synchronized 代 人 码 块 内 被 调用 ， 如 有 果 调 用 wait/notify 方 法 时 ， 当 前 线程 没 
有 持 有 对 象 锁 ， 会 抛 出 异常 java.lang.IlegalMonitor-StateException 。 


你 可 能 会 有 疑问 ， 如 果 wait 必 须 被 sywnchronized 保 护 ， 那 一 个 线程 在 
wait 时 ， 男 一 个 线程 怎么 可 能 调用 同样 被 synchronized 保 护 的 notify 方 法 
呢 ? 它 不 需要 等 待 锁 吗 ? 我 们 需要 进一步 理解 wait 的 内 部 过 程 ， 虽 然 是 
在 Synchronized 方 法 内 ， 但 调用 wait 时 ， 线 程 会 释放 对 象 锁 。 wait 的 具体 





1) 把 当前 线程 放 入 条 件 等 竺 队列， 释放 对 象 锁 ， 阻 塞 等 待 ， 线 程 
状态 变 为 WAITING 或 TIMED_WAITING。 


待 时 间 到 或 被 其 他 线程 调用 notify/notifyAll 从 条 件 队 列 中 移 
Re 要 重新 竞争 对 象 锁 


.如 果 能 够 获得 锁 ， 线 程 状态 变 为 RUNNABLE， 并 从 wait 调 用 中 返 
回 。 


否则， 该 线程 加 入 对 象 锁 等 竺 队列 ， 线 程 状态 变 为 BLOCKED， 只 
有 在 获得 锁 后 才 会 从 wait 调 用 中 返回 


线程 从 wait 调 用 中 返回 后 ， 不 代表 其 等 竺 的 条 件 束 一 定 成 也 了 ， 臣 
需要 重新 检查 其 等 竺 的 条 件 ， 一 般 的 调用 模式 是 : 





synchronized (obj) { 
while( 0 ) 
obj .wait( ); 
_// 执 行 委 件 满足 居 的 操作 





比如 ， 上 例 中 的 代码 是 : 





Synchronized (this) { 
while( !fire) { 
wait(); 
} 
} 





调用 notify 会 把 在 条 件 队列 中 等 待 的 线程 唤醒 并 从 队列 中 移 除 ， 但 
它 不 会 释放 对 象 锁 ， 电 训 是 说 ， 只 有 在 包 全 sodiy 的 synconized 代 所 
执行 完 后 ， 等 待 的 线程 才 会 从 wait 调 用 中 返回 


简单 总 结 一 下 ，wait/notify 方 法 看 上 去 很 简单 ， 但 往往 难以 理解 wait 
等 的 到 底 是 什么 ， 而 notify 通 知 的 又 是 什么 ， 我 们 需要 知道 ， 它 们 被 不 
同 的 线程 调用 ， 但 # Se 待 队 列 ( 相 同 对 象 的 
synchronized 代 码 块 内 ) ， 它 们 围绕 共享 的 条 件 变量 进行 协 作 ， 这 
个 条 件 变 量 是 程序 自己 维护 的 ， | 线程 调用 wait 进 入 条 
件 等 竺 队列 ， 另 一 个 线程 修改 了 条 件 变量 后 调用 notify， 调 用 wait 的 线程 














唤醒 后 需要 重新 检查 条 件 变 量 。 从 多 线程 的 角度 看 ， 它 们 围绕 共享 变量 
进行 协作 ， 从 调用 wait 的 线程 角度 看 ， 它 阻 紧 等 待 一 个 条 件 的 成 立 。 我 
们 在 设计 多 线程 协作 时 ， 需 要 想 清楚 协作 的 共享 变量 和 条 件 是 什么 ， 这 
是 协 作 的 核心 。 接 下 来 ， 我 们 通过 一 些 场景 进一步 理解 waitnotify 的 应 
用 。 





15.3.3 ”生产 者 /消费 者 模式 





在 生产 者 /消费 者 模式 中 ， 协 作 的 共 孚 变量 是 队列 ， 生 产 者 往 队 列 
上 放 数 据 ， 如 果 满 了 束 wait， 而 消费 者 从 队列 上 取 数 据 ， 如 果 队 列 为 空 
也 wait。 我 们 将 队列 作为 单独 的 类 进行 设计 ， 如 代码 清单 15-13 所 示 。 


代码 清单 15-13 ”生产 者 /消费 者 协作 队列 





static class MyBlockingQueue<E> { 
private Queue<E> queue = null; 
private int limit; 
public MyBlockingQueue(int limit) { 
this.limit = limit; 
dueue = new ArrayDeque<>(1imit); 
} 
public synchronized void put(E e) throws InterruptedException { 
while(queue.size() == limit) { 
wait(); 


queue.add(e); 
notifyAll(); 


public synchronized E take() throws InterruptedException { 
while(queue.isEmpty()) { 
wait(); 


E e = queue.poll(); 
notifyAll(); 
return e; 





MyBlockingQueue 是 一 个 长 度 有 限 的 队列 ， 长 度 通过 构造 方法 的 参 
数 进行 传递 ， 有 两 个 方法 : put 和 take。put 是 给 生产 者 使 用 的 ， 往 队列 
上 放 数 据 ， 满 了 就 wait， 放 完 之 后 调用 notifyAll， 通 知 可 能 的 消费 者 。 
take 是 给 消费 者 使 用 的 ， 从 队列 中 取 数 据 ， 如 有 末 为 空 就 wait， 取 完 之 后 
调用 notifyAll， 通 知 可 能 的 生产 者 。 


我 们 看 到 ，put 和 take 都 调用 了 wait， 但 它们 的 目的 是 不 同 的 ， 或 者 
说 ， 它 们 等 待 的 条 件 是 不 一 样 的 ，put 等 待 的 是 队列 不 为 满 ， 而 take 等 待 
的 是 队列 不 为 空 ， 但 它们 都 会 加 入 相同 的 条 件 等 竺 队列。 由 于 条 件 不 同 
但 又 使 用 相同 的 等 待 队 列 ， 所 以 要 调用 notifyAll 而 不 能 调用 notify， 因 为 
pe 能 唤醒 一 个 线程 ， 如 果 唤 醒 的 是 同类 线程 就 起 不 到 协调 的 作 


只 能 有 一 个 条 件 等 竺 队列， 这 是 Java wait/notify 机 制 的 局 限 性 ， 这 
使 得 对 于 等 待 条件 的 分 析 变 得 复杂 ， 后 续 章 节 我 们 会 介绍 显 式 的 锁 和 条 
件 ， 它 可 以 解决 该 问题 。 

一 个 简单 的 生产 者 代码 如 代码 清单 15-14 所 示 。 

代码 清单 15-14 ”一 个 简单 的 生产 者 











static class Producer extends Thread { 
MyBlockingQueue<String> queue 
public Producer(MyBlockingQueue<String> queue) { 
this.queue = queue; 


Q@Override 
public void run() { 
int num = 0; 
try { 
while(true) { 
String task = String.valueof(num); 
queue.put(task); 
System.out.printin("produce task " + task); 
num++; 
Thread.sleep((int) (Math.random() * 100)); 


} 
} catch (InterruptedException e) { 





Producer 同 共享 队列 中 插入 模拟 的 任务 数据 。 一 个 简单 的 消费 者 代 
码 如 代码 清单 15-15 所 示 。 


代码 清单 15-15 ”一 个 简单 的 消费 者 





static class Consumer extends Thread { 
MyBlockingQueue<String> queue; 
public Consumer (MyBlockingQueue<String> queue) { 
this.queue = queue; 


@Override 
public void run() { 
try { 
while(true) { 
String task = queue.take(); 
System.out.printin("handle task " + task); 
Thread.sleep((int)(Math.random( )*100)); 


} 
} catch(InterruptedException e) { 





主 程序 的 示例 代码 如 下 所 示 : 





public static void main(String[] args) { 
MyBlockingQueue<String> queue = new MyBlockingQueue<>(10); 
new Producer (queue).start(); 
new Consumer (queue).start(); 


} 





运行 该 程序 ， 会 看 到 生产 者 和 消费 者 线程 的 输出 交替 出 现 。 


我 们 实现 的 MyBlockingQueue 主 要 用 于 演示 ，Java 提 供 了 专门 的 阻 
塞 队 列 实现 ， 包 括 : 


.接口 BlockingQueue 和 BlockingDeque。 


.基于 数组 的 实现 类 ArrayBlockingQueue。 





.基于 链表 的 实现 类 LinkedBlockingQueue 和 LinkedBlockingDeque。 
.基于 扒 的 实现 类 PriorityBlockingQueue。 
我 们 会 在 后 续 重 介绍 这 些 类 ， 在 实际 系统 中 ， 应 该 优先 考虑 使 用 


15.3.4 同时 开始 


同时 开始 ， 类 似 于 运动 员 比赛 ， 在 听 到 比赛 开始 枪 响 后 同时 开始 ， 
下 面 ， 我 们 模拟 这 个 过 程 。 这 里 ， 有 一 个 主线 程 和 N 个 子 线程 ， 每 个 子 
线程 模拟 一 个 运动 员 ， 主 线程 模拟 裁判 ， 它 们 协作 的 共享 变量 是 一 个 开 








外 号 。 我 们 用 一 个 类 FireFlag 来 表示 这 个 协作 对 象 ， 如 代码 清单 15-16 
钞 。 


代码 清单 15-16 ”协作 对 象 FireFlag 





static class FireFlag { 
private volatile boolean fired = false; 
public synchronized void waitForFire() throws InterruptedException { 
while(!fired) { 
wait(); 
} 


public synchronized void fire() { 
this.fired = true; 
notifyAll(); 





子 线程 应 该 调用 waitForFire 〈) 等 待 枪 啊 ， 而 主线 程 应 该 调用 
fire〈) 发 射 比 赛 开 始 信号。 


表示 比赛 运动 员 的 类 如 代码 清单 15-17 所 示 。 


代码 清单 15-17 表示 比赛 运动 员 的 类 











static class Racer extends Thread { 
FireFlag fireFlag; 
public Racer(FireFlag fireFlag) { 
this.fireFlag = fireFlag,; 


} 
Q@Override 
public void run() { 
try { 
this.fireFlag.waitForFire(); 
System.out.printin("start run " 
+ Thread.currentThread().getName()); 
} catch (InterruptedException e) { 
} 
} 





主 程序 代码 如 下 所 示 : 





public static void main(String[] args) throws InterruptedException { 
int num = 10; 
FireFlag fireFlag = new FireFlag(); 
Thread[] racers = new Thread[num]; 


for(int i = 0; i < num; i++) { 
racers[i] = new Racer (fireFlag); 
racers[i].start(); 


} 
Thread. sleep(1000); 
fireFlag.fire(); 





这 里 ， 司 动 了 10 个 子 线程 ， 每 个 子 线程 月 动 后 等 竺 fire 信 和 号， 主线 
程 调用 fire〈) 后 各 个 子 线程 才 开始 执行 后 续 操 作 。 





15.3.5 ”等待 结束 


在 15.1.2 节 中 我 们 使 用 join 方法 让 主线 程 等 待 子 线程 结束 ，join 实 际 
上 就 是 调用 了 wait， 其 主要 代码 是 : 





while (isAlive()) { 
wait(0); 





只 要 线程 是 活着 的 ，isAlive() 返回 true，join 束 一 直 等 待 。 谁 来 通 
知 它 呢 ? 当 线 程 运行 结束 的 时 候 ，Java 系 统 调 用 notifyAl 来 通知 。 


使 用 join 有 时 比较 麻烦 ， 需 要 主线 程 逐 一 等 待 每 个 子 线程 。 这 里 ， 
我 们 演示 一 种 新 的 写法 。 主 线程 与 各 个 子 线程 协作 的 共享 变量 是 一 人 
数 ， 这 个 数 表示 未 完成 的 线程 个 数 ， 初 始 值 为 子 线程 个 数 ， 主 线程 等 待 
该 值 变 为 0， 而 每 个 子 线程 结束 后 都 将 该 值 减 一 ， 当 减 为 0 时 调用 
notifyAll， 我 们 用 MyLatch 来 表示 这 个 协作 对 象 ， 如 代码 清单 15-18 所 
外。 














代码 清单 15-18 ”协作 对 象 MyLatch 





public class MyLatch f{ 
private int count; 
public MyLatch(int count) { 
this.count = count,; 


public synchronized void await() throws InterruptedException { 


while(count > 0) { 
wait(); 


public synchronized void countDown() { 


count--， 
if(count <= 0) { 

notifyAll(); 
} 


} 





这 里 ，MyLatch 构 造 方法 的 参数 count 应 初始 化 为 子 线 程 的 个 数 ， 主 
线程 应 该 调用 await () ， 而 子 线程 在 执行 完 后 应 该 调用 
countDown () 。 工 作 子 线程 的 示例 代码 如 代码 清单 15-19 所 示 。 


代码 清单 15-19 ”使 用 MyLatch 的 工作 子 线程 





static class Worker extends Thread { 
MyLatch latch; 
public Worker(MyLatch latch) { 
this.latch = latch,; 


Q@Override 
public void run() { 
try { 
//simulate working on task 
Thread.sleep((int) (Math.random() * 1000)); 
this.1latch.countDown( ); 
} catch (InterruptedException e) { 





主线 程 的 示例 代码 如 下 : 





public static void main(String[] args) throws InterruptedException { 
int workerNum = 100; 
MyLatch latch = new MyLatch(workerNum); 
Worker[] workers = new Worker[workerNum]; 
for(int i = 0; i < workerNum; i++) { 
workers[i] = new Worker(latch); 
workers[i].start(); 


latch.await(); 
System.out.println("collect worker results"); 











MyLatch 是 一 个 用 于 同步 协作 的 工具 类 ， 主 要 用 于 演示 基本 原理 ， 
在 Java 中 有 一 个 专门 的 同步 类 CountDownLatch， 在 实际 开发 中 应 该 使 用 
它 。 关 于 CountDownLatch， 我 们 会 在 后 续 章 节 介 绍 。 





MyLatch 的 功能 是 比较 通用 的 ， 它 也 可 以 应 用 于 上 面 “同时 开始 ”的 
场景 ， 初 始 值 设 为 1，Racer 类 调用 await () ， 主 线程 调用 
countDown () 即 可 ， 如 代码 清单 15-20 所 示 。 


代码 清单 15-20 ”使 用 MyLatch 实 现 同时 开始 





public class RacerWithLatchDemo { 
static class Racer extends Thread { 
MyLatch latch,; 
public Racer(MyLatch latch) { 
this.latch = latch,; 


@Override 
public void run() { 
try { 
this.latch.await(); 
System.out.printin("start run " 
+ Thread.currentThread().getName()); 
} catch (InterruptedException e) { 
} 
} 


public static void main(String[] args) throws InterruptedException { 
int num = 10; 
MyLatch latch = new MyLatch(1); 
Thread[] racers = new Thread[num]; 
for(int i = 0; i < num; i++) { 
racers[i] = new Racer(latch); 
racers[i].start(); 


} 
Thread.sleep(1000); 
latch.countDown( ) ; 





15.36 和 异步 结果 


在 主 从 模式 中 ， 手 工 创建 线程 往往 比较 矿 烦 ， 一 种 滑 见 的 模式 是 异 
Sa 异步 调用 返回 一 个 一 般 称 为 Future 的 对 象 ， 通 过 它 可 以 获得 最 
终 的 结果 。 在 Java 中 ， 表 示 子 任务 的 接口 是 Callable， 声 明 为 : 








public interface Callable<V> { 
V call() throws Exception; 





为 表示 异步 调用 的 结果 ， 我 们 定义 一 个 接口 MyFuture， 如 下 所 示 : 





public interface MyFuture <V> { 
V get() throws Exception ; 





这 个 接口 的 get 方 法 返回 真正 的 结果 ， 如 果 结 果 还 没有 计算 完成 ， 
get 方 法 会 阻塞 直到 计算 完成 ， 如 果 调 用 过 程 发 生 异 常 ， 则 get 方 法 抛 出 
调用 过 程 中 的 异 第 。 


为 方便 主线 程 调 用 子 任务 ， 我 们 定义 一 个 类 MyExecutor， 其 中 定义 
一 个 public 方 法 execute， 表 示 执 行 子 任务 并 返回 异步 结果 ， 声 明 如 下 : 











public <V> MyFuture<V> execute(final Callable<V> task) 





利用 该 方法 ， 对 于 主线 程 ， 就 不 需要 创建 并 管理 子 线 程 了 ， 并 且 可 
以 方便 地 获取 异步 调用 的 结果 。 比如 ， 在 主线 程 中 ， 可 以 类 似 代 码 清 
单 15-21 那 样 局 动 寞 步调 用 并 获取 结 


代码 清单 15-21 异步 调用 示例 








public static void main(String[] args) { 
MyExecutor executor = new MyExecutor(); 
// 子 任务 
Callable<Integer> subTask = new Callable<Integer>() { 
@Override 
public Integer call() throws Exception { 
//.… 执 行 异步 任务 
int millis = (int) (Math.random() * 1000); 
Thread.sleep(millis); 
return millis; 








} 
}; 
// 异 步调 用 ， 返 回 一 个 MyFuture 对 象 
MyFuture<Integer> future = executor.execute(subTask); 
//.. 执 行 其 他 操作 
try { 
// 获 取 异 步调 用 的 结果 
Integer result = future.get(); 
System.out.printlin(result); 
} catch(Exception e) { 
e.printSstackTrace( ); 
























































MyExecutor 的 execute 方 法 是 怎么 实现 的 呢 ? 它 封装 了 创建 子 线程 ， 


同步 获取 结果 的 过 程 ， 它 会 创建 一 个 执行 子 线程 ， 该 子 线程 如 代码 清单 
15-22 所 示 。 


代码 清单 15-22 ”执行 子 线程 ExecuteThread 





static class ExecuteThread<V> extends Thread { 
private V result = null; 
private Exception exception = null; 
private boolean done = false; 
private Callable<V> task,; 
private Object lock; 
public ExecuteThread(Callable<V> task, Object lock) { 
this.task = task; 
this.lock = lock; 
} 
QOverride 
public void run() { 
try { 
result = task.call(); 
} catch (Exception e) { 
exception = e; 
} finally { 
synchronized (lock) { 
done = true; 
lock.notifyAll(); 


} 


} 

public V getResult() { 
return result,; 

} 


public boolean isDone() { 
return done,; 


public Exception getException() { 
return exception; 
} 








这 个 子 线程 执行 实际 的 子 任务 ， 记 录 执 行 结果 到 result 变 量 、 异 常 
到 exception 变 量 ， 执 行 结束 后 设置 共享 状态 变量 done 为 tue， 并 调用 
notifyAll， 以 唤醒 可 能 在 等 待 结 果 的 主线 程 。 

MYyExecutor 的 execute 方 法 如 代码 清单 15-23 所 示 。 


代码 清单 15-23 ”异步 执行 任务 

















public <V> MyFuture<V> execute(final Callable<V> task) { 
final Object lock = new Object(); 
final ExecuteThread<V> thread = new ExecuteThread<>(task, lock); 


thread. start(); 
MyFuture<V> future = new MyFuture<V>() { 
@Override 
public V get() throws Exception { 
synchronized (lock) { 
while(!thread.isDone()) { 
try { 
lJock.wait(); 
} catch (InterruptedException e) { 


} 
if(thread.getException() != null) { 
throw thread.getException(); 


} 
return thread.getResult(); 
} 
} 


/ 
return future 





execute 启 动 一 个 线程 ， 并 返回 MyFuture 对 象 ，MyFuture 的 get 方 法 
会 阻塞 等 待 直到 线程 运行 结束 。 


以 上 的 MyExecutore 和 MyFuture 主 要 用 于 演示 基本 原理 ， 实 际 上 ， 
Java 中 已 经 包含 了 一 套 完善 的 框架 Executors， 相 关 的 部 分 接口 和 类 有 : 


.表示 异步 结果 的 接口 Future 和 实现 类 FutureTask。 


:用 于 执行 异步 任务 的 接口 Executor， 以 及 有 更 多 功能 的 子 接口 


ExecutorService。 











:用 于 创建 Executor 和 ExecutorService 的 工厂 方法 类 Executors。 


后 续 章节 ， 我 们 会 详细 介绍 这 套 框架 。 
15.3.7 集合 庶 


各 个 线程 先是 分 头 行动 ， 各 自 到 达 一 个 集合 点 ， 在 集合 点 需要 集 齐 
所 有 线程 ， 交 换 数据 ， 然 后 再 进行 下 一 步 动 作 。 怎 么 表示 这 种 协作 呢 ? 
协作 的 共享 变量 依然 是 一 个 数 ， 这 个 数 表示 未 到 集合 点 的 线程 个 数 ， 初 
始 值 为 子 线程 个 数 ， 每 个 线程 到 达 和 集合 点 后 将 该 值 减 一 ， 如 采 不 为 0， 
表示 还 有 别 的 线程 未 到 ， 进 行 等 等 ， 如 果 变 为 0， 表 示 自 己 是 最 后 一 个 
到 的 ， 调 用 notifyAll 唤 醒 所 有 线程 。 我 们 用 AssemblePoint 类 来 表示 这 个 


























协作 对 象 ， 如 代码 清单 15-24 所 示 。 
代码 清单 15-24 ”协作 对 象 AssemblePoint 





public class AssemblePoint 区 
private int n,; 
public AssemblePoint(int n) { 
this.n = n; 


public synchronized void await() throws InterruptedException { 


if(n > 0) { 
Nn--, 
if(n == 0) { 
notifyAll( ); 
} else { 
while(n != 0) { 
wait(); 
} 
} 





多 个 游客 线程 各 目 先 独立 运行 ， 然 后 使 用 该 协作 对 象 到 达 集 合 点 进 
行 同步 的 示例 如 代码 清单 15-25 所 示 。 


代码 清单 15-25 ”集合 点 协作 示例 





public class AssemblePointDemo { 
static class Tourist extends Thread { 
AssemblePoint ap; 
public Tourist(AssemblePoint ap) { 
this.ap = ap; 









































} 
@Override 
public void run() { 
try { 
// 模 拟 先 各 自 独立 运行 
Thread.sleep((int) (Math.random() * 1000)); 
// 集 合 
ap.await()， 
System.out.printin("arrived"); 
//… 集 合 后 执行 其 他 操作 
} catch (InterruptedException e) { 
} 
} 


public static void main(String[] args) { 
int num = 10; 
Tourist[] threads = new Tourist[num]; 
AssemblePoint ap = new AssemblePoint(num); 
for(int i = 0; i < num; i++) { 


threads[i] = new Tourist(ap); 
threads[i].start(); 
} 
} 
} 











这 里 实现 的 AssemblePoint 主 要 用 于 演示 基本 原理 ，Java 中 有 一 个 专 
门 的 同步 工具 类 CyclicBarrier 可 以 蔡 代 它 ， 关 于 该 类 ， 我 们 后 续 章 节 介 
绍 。 


15.3.8 四 结 


本 节 介 绍 了 Java 中 线程 间 协 作 的 基本 机 制 wait/notify， 协 作 关 键 要 想 
清楚 协作 的 共享 变量 和 条 件 是 什么 ， 为 进一步 理解 ， 针 对 多 种 协作 场 
景 ， 我 们 演示 了 wait/notify 的 用 法 及 基本 协作 原理 。Java 中 有 专门 为 协作 
而 建 的 阻塞 队列 、 同 步 工 具 类 ， 以 及 Executors 框 架 ， 我 们 会 在 后 续 章 节 
在 实际 开发 中 ， 应 该 尽量 使 用 这 些 现成 的 类 ， 而 非 “ 重 新 发 明 轮 








15.4 线程 的 中 断 


本 节 主 要 讨论 一 个 问题 ， 如 何在 Java 中 取消 或 关闭 一 个 线程 ?我 们 
先 介绍 都 有 哪些 场景 需要 取消 /关闭 线程 ， 再 介绍 取消 /关闭 的 机 制 ， 以 
及 线程 对 中 断 的 反应 ， 最 后 讨论 如 何 正确 地 取消 /关闭 线程 。 


15.4.1 取消 /关闭 的 场景 


我 们 知道 ， 通 过 线程 的 start 方 法 启动 一 个 线程 后 ， 线 程 开 始 执行 run 
方法 ，run 方 法 运行 结束 后 线程 退出 ， 那 为 什么 还 需要 结束 一 个 线程 
呢 ? 有 多 种 情况 ， 比 如 : 


1) 很 多 线程 的 运行 模式 是 死 循 坏 ， 比 如 在 生产 者 /消费 者 模式 中 ， 
消费 者 主体 就 是 一 个 死 循 环 ， 它 不 停 地 从 队列 中 接受 任务 ， 执 行 任务 ， 
在 停止 程序 时 ， 我 们 需要 一 种 “优雅 ”的 方法 以 关闭 该 线程 。 


2) 在 一 些 图 形 用户 界 面 程 序 中， 线程 是 用 户 局 动 的 ， 完 成 一 些 任 
务 ， 比 如 从 远程 服务 器 上 下 载 一 个 文件 ， 在 下 载 过 程 中 ， 用 户 可 能 会 硕 
望 取 消 该 任务 。 

3) 在 一 些 场景 中 ， 比 如 从 第 三 方 服 务 器 查询 一 个 结果 ， 我 们 而 望 
在 限定 的 时 间 内 得 到 结果 ， 如 果 得 不 到 ， 我 们 会 希望 取消 该 任务 。 

4) 有 时 ， 我 们 会 局 动 多 个 线程 做 同一 件 事 ， 比 如 类 似 抢 火 车 票 ， 
我 们 可 能 会 让 多 个 好 友和 帮忙 从 多 个 渠道 买 火车 票 ， 只 要 有 一 个 渠道 买 到 
了 ， 我 们 会 通知 取消 其 他 渠道 。 








15.4.2 ”取消 /关闭 的 机 制 


Java 的 Thread 类 定义 了 如 下 方法 : 





public final void stop() 





这 个 方法 看 上 去 就 可 以 停止 线程 ， 但 这 个 方法 被 标记 为 了 过 时 ， 简 
单 地 说 ， 我 们 不 应 该 使 用 它 ， 可 以 忽略 它 。 

在 Java 中 ， 停 止 一 个 线程 的 主要 机 制 是 中 断 ， 中 断 并 不 是 强迫 终止 
一 个 线程 ， 它 是 一 种 协作 机 制 ， 是 给 线程 传递 一 个 取消 信号 ， 但 是 由 线 
程 来 决定 如 何以 及 何 时 退出 。 本 节 我 们 主要 就 是 来 理解 Java 的 中 断 机 
制 。 


Thread 类 定义 了 如 下 关于 中 上 断 的 方法 : 











public boolean isInterrupted() 
public void interrupt() 
public static boolean interrupted() 





这 三 个 方法 名 字 类 似 ， 比 较 容易 混淆 ， 我 们 解释 一 下 。 
isInterrupted () 和 interrupt〈) 是 实例 方法 ， 调 用 它们 需要 通过 线程 对 
象 ; interrupted〈) 是 静态 方法 ， 实 际会 调用 Thread.currentThread 〈) 操 
作 当 前 线程 。 


每 个 线程 都 有 一 个 标志 位 ， 表 示 该 线程 是 否 被 中 断 了 。 

1) isInterrupted: 返回 对 应 线程 的 中 断 标 志 位 是 否 为 true。 

2) interrupted: 返回 当前 线程 的 中 断 标 志 位 是 否 为 tue， 但 它 还 有 
一 个 重要 的 副作用 ， 束 是 清空 中 断 标 志 位 ， 也 就 是 说 ， 连 续 两 次 调用 
interrupted () ， 第 一 次 返回 的 结果 为 tue， 第 二 次 一 般 就 是 false。 (除非 
同时 又 发 生 了 一 次 中 断 ) 。 


3) interrupt: 表示 中 断 对 应 的 线程 。 中 断 具 体 意味 着 什么 呢 ? 下 面 
我 们 进一步 来 说 明 。 














15.4.3 ”线程 对 中 断 的 反应 





interrupt〈) 对 线程 的 影响 与 线程 的 状态 和 在 进行 的 IO 操作 有 关 。 
我 们 主要 考虑 线程 的 状态 ，IO 操 作 的 影响 和 具体 IO 以 及 操作 系统 有 关 ， 
我 们 就 不 讨论 了 。 线 程 状态 有 : 








.RUNNABLE: 线程 在 运行 或 具备 运行 条 件 只 是 在 等 待 操作 系统 调 








度 。 
-WAITING/TIMED_WAITING: 线程 在 等 待 某 个 条 件 或 超时 。 
.BLOCKED: 线程 在 等 竺 锁 ， 试 图 进入 同步 块 。 
:NEW/TERMINATED: 线程 还 未 启动 或 已 结束 。 
1.RUNNABLE 


如 条 线程 在 运行 中 ， 且 没有 执行 IO 操作 ，interupt〈) 只 古 会 设置 
线程 的 中 断 标 志 位 ， 没 有 任何 其 他 作用 。 线 程 应 该 在 运行 过 程 中 合适 的 
位 置 检 查 中 断 标志 位 ， 比 如 ， 如 果 主 体 代 码 是 一 个 循环 ， 可 以 在 循环 开 
始 处 进行 检查 ， 如 下 所 示 : 








public class InterruptRunnableDemo extends Thread { 
QOverride 
public void run() { 
while(!Thread.currentThread().isInterrupted()) { 
//.. 单 次 循环 代码 





System,out .println("done "); 


} 
// 其 他 代码 





2.WAITING/TIMED_WAITING 


线程 调用 join/wait/sleep 方 法 会 进入 WAITING 或 TIMED_WAITING 
状态 ， 在 这 些 状 态 时 ， 对 线程 对 象 调 用 interrupt〈() 会 使 得 该 线程 抛 出 
InterruptedException。 需 要 注意 的 是 ， 抛 出 异常 后 ， 中 断 标 志 位 会 被 清 
空 ， 而 不 是 被 设置 。 比如 ， 执 行 如 下 代码 : 








Thread t = new Thread (){ 
@Override 
public void run() { 
try { 
Thread. sleep(1000); 
} catch (InterruptedException e) { 
System.out.printiln(isInterrupted()); 


}; 


t.start(); 


try { 
Thread. sleep(100); 
} catch (InterruptedException e) { 


t.interrupt(); 





程序 的 输出 为 false。 


InterruptedException 是 一 个 受 检 异常 ， 线 程 必 须 进行 处 理 。 我 们 在 
腊 音 处 理 中 介绍 过 ， 处 理 异常 的 基本 思路 是 : 如 条 知道 怎么 处 理 ， 融 进 
行 处 理 ， 如 果 不 知道 ， 就 应 该 加 上 传递 ， 通 常情 况 下 不 应 该 捕获 异常 然 
后 忽略 。 


捕获 到 InterruptedException， 通 党 表示 和 希望 结束 该 线程 ， 线 程 大 致 
有 了 两 种 处 理 方式 : 


1) 同上 传递 该 异常 ， 这 使 得 该 方法 也 变 成 了 一 个 可 中 断 的 方法 ， 
需要 调用 者 进行 处 理 ; 


2) 有 些 情况 ， 不 能 同上 传递 异常 ， 比 如 Thread 的 run 方 法 ， 它 的 声 
明和 是 固定 的 ， 不 能 抛 出 任何 受 检 有 异 前 ， 这 时 ， 应 该 捕获 异 帝 ， 进 行 合适 
的 清理 操作 ， 清 理 后 ， 一 般 应 该 调用 Thread 的 interrupt 方 法 设置 中 断 标 
志 位 ， 使 得 其 他 代码 有 办 法 知道 它 发 生 了 中 新 。 


第 一 种 方式 的 示例 代码 如 下 : 














public void interruptibleMethod() throws InterruptedException{ 
//.… 包 含 Wait，join 或 sleep 方法 
Thread. sleep(1000); 





} 





第 二 种 方式 的 示例 代码 如 下 : 





public class InterruptwaitingDemo extends Thread { 
Q@Override 
public void run() { 
while(!Thread.currentThread().isInterrupted()) { 
try { 
// 模 拟 任 务 代 码 
Thread.sleep(2000); 
} catch(InterruptedException e) { 
//... 清 理 操作 








// 重 设 中 断 标志 位 


Thread.currentThread().interrupt(); 








} 
System.out.println(isInterrupted()); 
} 
// 其 他 代码 
} 
3.BLOCKED 


如 果 线 程 在 等 待 锁 ， 对 线程 对 象 调 用 interrupt () 只 是 会 设置 线程 
的 中 断 标志 位 ， 必修 会 如 BLOCKED 民 2 也 就 是 说 ， 
interrupt () 并 不 能 使 一 个 在 等 待 锁 的 线程 真正 中断”。 我 们 看 段 代 
码 : 





public class InterruptSynchronizedDemo { 
private static Object lock = new Object(); 
private static class A extends Thread { 
@Override 
public void run() { 
synchronized (lock) { 
while (!Thread.currentThread().isInterrupted()) { 


System.out.printilin("exit"); 


public static void test() throws InterruptedException { 
synchronized (lock) { 
Aa= new A(); 
a.start(); 
Thread. sleep(1000); 
a.interrupt(); 
a.join(); 


} 


public static void main(String[] args) throws InterruptedException { 
test(); 











test 方 法 在 持 有 锁 lock 的 情况 下 局 动 线程 a， 而 线程 a 也 去 答 试 获得 锁 
lock， 所 以 会 进入 锁 等 待 队列 ， 随 后 test 调 用 线程 a 的 interrupt 方 法 并 调用 
join 等 待 线程 线程 a 结 束 ， 线 程 a 会 结束 吗 ? 不 会 ，interrupt 方 法 只 会 设置 
线程 的 中 断 标志 ， 而 并 不 会 使 它 从 锁 等 待 队列 中 出 来 。 


在 使 用 synchronized 关 键 字 获取 锁 的 过 程 中 不 啊 应 中 断 请 求 ， 这 是 
synchronized 的 局 限 性 。 如 果 这 对 程序 是 一 个 问题 ， 应 该 使 用 显 式 锁 。 














第 16 章 会 介绍 显 式 锁 Lock 接 口 ， 它 支持 以 响应 中 断 的 方式 获取 锁 。 
4.NEW/TERMINATE 


如 果 线 程 尚未 启动 (NEW) ， 或 者 已 经 结束 (TERMINATED) ， 
则 调用 interrupt () 对 它 没 有 任何 效果 ， 中 断 标志 位 也 不 会 被 设置 。 








15.4.4 ”如 何 正确 地 取消 /关闭 线程 


interrupt 方 法 不 一 定 会 真正 “中 上 断 ” 线 程 ， 它 只 是 一 种 协作 机 制 ， 如 
果 不 明白 线程 在 做 什么 ， 不 应 该 贸然 地 调用 线程 的 interrupt 方 法 ， 以 为 
这 样 就 能 取消 线程 。 


对 于 以 线程 提供 服务 的 程序 模块 而 言 ， 它 应 该 封装 取消 /关闭 操 
作 ， 提 供 单 独 的 取消 /关闭 方法 给 调用 者 ， 外 部 调用 者 应 该 调用 这 些 方 
法 而 不 是 直接 调用 interrupt。 Java 并 发 库 的 一 些 代 码 束 提供 了 单独 的 取 
消 / 关 闭 方法 ， 比 如 ，Future 接 口 提供 了 如 下 方法 以 取消 任务 : 





boolean cancel(boolean mayInterruptIfRunning); 





再 如 ，ExecutorService 提 供 了 如 下 两 个 关闭 方法 : 





void shutdown(); 
List<Runnable> shutdownNow(); 








Future 和 ExecutorService 的 API 文 档 对 这 些 方法 都 进行 了 详细 说 明 ， 
这 是 我 们 应 该 学 习 的 方式 。 关 于 这 两 个 接口 ， 我 们 后 续 章节 介绍 。 





15.4.5 ”小 结 


本 节 主 要 介绍 了 在 Java 中 如 何 取消 /关闭 线程 ， 主 要 依赖 的 技术 是 中 
断 ， 但 它 是 一 种 协作 机 制 ， 不 会 强迫 终止 线程 ， 我 们 介绍 了 线程 在 不 同 
状态 下 对 中 断 的 反应 。 作 为 线程 的 实现 者 ， 应 该 提供 明确 的 取消 /关闭 
方法 ， 并 用 文档 摘 述 清楚 其 行为 ， 作 为 线程 的 调用 者 ， 应 该 使 用 其 取 
消 /关闭 方法 ， 而 不 是 贸然 调用 interrupt。 





至 此 ， 关 于 线程 的 基础 内 容 就 介绍 完了 。 在 Java 中 还 有 一 套 并 发 工 
有 具 包 ， 位 于 包 java.util.concurrent 下 ， 里 面包 括 很 多 易 用 且 高 性 能 的 并 发 
开发 工具 ， 从 下 一 章 开始 ， 我 们 就 来 讨论 它 ， 先 从 最 基本 的 原子 变量 和 
CAS (Compare And Set) 操作 开始 。 


第 16 章 ”并 太 包 的 基石 


15 章 介绍 了 线程 的 基本 内 容 ， 在 Java 中 还 有 一 套 并 发 工具 包 ， 位 于 
包 java.util.concurrent 下 ， 里 面包 括 很 多 易 用 且 高 性 能 的 并 发 开发 工具 。 
从 本 章 开 始 ， 我 们 就 来 探讨 Java 并 发 工具 包 。 


本 章 主 要 介绍 并 发 包 的 一 些 基础 内 容 ， 分 为 3 个 小 节 : 16.1 节 介绍 
最 基本 的 原子 变量 及 其 背后 的 原理 和 思维 ; 16.2 节 介绍 可 以 替代 
Synchronized 的 显 式 锁 ;，16.3 节 介绍 可 以 蔡 代 waitmnotify 的 显 式 条 件 。 





16.1 原子 变量 和 CAS 


什么 是 原子 变量 ? 为 什么 需要 它们 呢 ? 我 们 从 synchronized 说 起 。 
在 15.2 节 ， 我 们 介绍 过 Counter 类 ， 使 用 synchronized 关 键 字 保证 原子 更 
新 操作 ， 代 码 如 下 : 





public class Counter 1{ 
private int count; 
public synchronized void incr(){ 
count ++; 


} 

public synchronized int getCount() { 
return count; 

} 


} 





对 于 count++ 这 种 操作 来 说 ， 使 用 synchronized 成 本 太 高 了 ， 需 要 先 
获取 锁 ， 最 后 需要 释放 锁 ， 获 取 不 到 锁 的 情况 下 需要 等 待 ， 还 会 有 线程 
的 上 下 文 切换 ， 这 些 都 需要 成 本 。 

对 于 这 种 情况 ， 完 全 可 以 使 用 原子 变量 代替 ，Java 并 发 包 中 的 基本 
原子 变量 类 型 有 以 下 几 种 。 


.AtomicBoolean: 原子 Boolean 类 型 ， 常 用 来 在 程序 中 表示 一 个 标志 











位 。 

“AtomicInteger: 原子 Integer 类 型 。 

AtomicLong: 原子 Long 类 型 ， 第 用 来 在 程序 中 生成 唯一 序列 号 。 
AtomicReference: 原子 引用 类 型 ， 用 来 以 原子 方式 更 新 复杂 类 


限于 篇 幅 ， 我 们 主要 介绍 AtomicInteger。 除 了 这 4 个 类 ， 还 有 一 些 
其 他 类 ， 如 针对 数组 类 型 的 类 AtomicLongArray、 
AtomicReferenceArray， 以 及 用 于 以 原子 方式 更 新 对 象 中 的 字段 的 类 ， 
如 AtomicIntegerFieldUpdater、AtomicReferenceFieldUpdater 等 。Java 8 增 
加 了 几 个 类 ， 在 高 并 发 统计 汇总 的 场景 中 更 为 适合 ， 包 括 LongAdder、 





LongAccumulator、Double-Adder 和 DoubleAccumulator， 上 有 具体 可 参见 API 
文档 ， 我 们 就 不 介绍 了 。 


16.1.1 AtomicInteger 


我 们 先 介 绍 AtomicInteger 的 基本 用 法 ， 然 后 介绍 它 的 基本 原理 和 你 
辑 ， 以 及 应 用 。 


1. 基 本 用 法 
AtomicInteger 有 两 个 构造 方法 : 





public AtomicInteger(int initialValue) 
public AtomicInteger() 





第 一 个 构造 方法 给 定 了 一 个 初始 值 ， 第 二 个 构造 方法 的 初始 值 为 





可 以 直接 获取 或 设置 AtomicInteger 中 的 值 ， 方 法 是 : 





public final int get() 
public final void set(int newValue) 











之 所 以 称 为 原子 变量 ， 是 因为 它 包含 一 些 以 原子 方式 实现 组 合 操 作 
的 方法 ， 部 分 方法 如 下 : 





















































// 以 原子 方式 获取 旧 值 并 设置 新 值 

public final int getAndSet(int newValue) 
// 以 原子 方式 获取 旧 值 并 给 当前 值 加 1 

public final int getAndIncrement() 

// 以 原子 方式 获取 旧 值 并 给 当前 值 减 1 

public final int getAndDecrement() 

// 以 原子 方式 获取 旧 值 并 给 当前 值 加 delta 











public final int getAndAdd(int delta) 
// 以 原子 方式 给 当前 值 加 1 并 获取 新 值 

public final int incrementAndGet() 

// 以 原子 方式 给 当前 值 减 1 并 获取 新 值 

public final int decrementAndGet() 
// 以 原子 方式 给 当前 值 加 delta 并 获取 新 值 
public final int addAndGet(int delta) 
这 些 方法 的 实现 都 依赖 男 一 个 public 方 法 : 
public final boolean compareAndSet(int expect, int update) 





















































这 些 方法 的 实现 部 依赖 男 一 个 public 方 法 : 





public final boolean compareAndSet(int expect, int update) 





compareAndSet 古 一 个 非常 重要 的 方法 ， 比 较 并 设置 ， 我 们 以 后 将 
简称 为 CAS。 该 方法 有 两 个 参数 expect 和 update， 以 原子 方式 实现 了 如 
下 功能 : 如 果 当 前 值 等 于 expect， 则 更 新 为 update， 人 否则 不 更 新 ， 如 果 
更 新 成 功 ， 返 回 true， 和 否则 返回 false。 


AtomicInteger 可 以 在 程序 中 用 作 一 个 计数 器 ， 多 个 线程 并 肥 更 新 ， 
也 总 能 实现 正确 性 。 我 们 看 个 例子 ， 如 代码 清单 16-1 所 示 。 


代码 清单 16-1 AtomicInteger 的 应 用 示例 





public class AtomicIntegerDemo { 
private static AtomicInteger counter = new AtomicInteger(0); 
static class Visitor extends Thread { 
@Override 
public void run() { 
for(int i = 0; i < 1000; i++) { 
counter.incrementAndGet(); 
} 


} 


public static void main(String[] args) throws InterruptedException { 
int num = 1000; 
Thread[] threads = new Thread[num]; 
for(int i = 0; i < num; i++) { 
threads[i] = new Visitor(); 
threads[i].start(); 


for(int i = 0; i < num; i++) { 
threads[i].join(); 


System.out.println(counter .get()); 





程序 的 输出 总 是 正确 的 ， 为 1000000。 
2. 基 本 原理 和 思维 


AtomicInteger 的 使 用 方法 是 简单 直接 的 ， 它 是 怎么 实现 的 呢 ? 它 的 
主要 内 部 成 员 是 : 


private volatile int Value 





注意 : 它 的 声明 带 有 volatile， 这 是 必需 的 ， 以 保证 内 存 可 见 性 。 


它 的 大 部 分 更 新 方法 实现 者 类似， 我 们 看 一 个 方法 
incrementAndGet， 其 代码 为 : 





public final int incrementAndGet() { 
for(;;) { 


int current = get(); 

int next = current + 1; 

if(compareAndSet(current, next)) 
return next; 





代码 主体 是 个 死 循环 ， 先 获取 当前 值 current， 计 算 期 望 的 值 next， 
然后 调用 CAS 方 法 进行 更 新 ， 如 果 更 新 没有 成 功 ， 说 明 value 被 别 的 线程 
改 了 ， 则 再 去 取 最 新 值 并 党 试 更 新 直到 成 功 为 止 。 


与 Synchronized 锁 相 比 ， 这 种 原子 更 新 方式 代表 一 种 不 同 的 思维 方 
式 。synchronized 是 悲观 的 ， 它 假定 更 新 很 可 能 种 突 ， 所 以 先 获 取 锁 ， 
得 到 锁 后 才 更 新 。 原 子 变 量 的 更 新 逻辑 是 乐观 的 ， 它 假定 冲突 比较 
少 ， 但 使 用 CAS 更 新 ， 也 就 是 进行 冲突 检测 ， 如 果 确 实 冲 突 了 ， 那 也 没 
关系 ， 继 续 尝 试 就 好 了 。synchronized 代 表 一 种 阻塞 式 算 法 ， 得 不 到 锁 
的 时 候 ， 进 入 锁 等 竺 队列， 等 待 其 他 线程 唤醒 ， 有 上 下 文 切换 开销 。 原 
子 变量 的 更 新 逻辑 是 非 阻 塞 式 的 ， 更 新 冲突 的 时 候 ， 它 就 重 试 ， 不 会 
阻塞 ， 不 会 有 上 下 文 切换 开销 。 对 于 大 部 分 比较 简单 的 操作 ， 无 论 是 在 
低 并 发 还 是 高 并 发 情况 下 ， 这 种 乐观 非 阻塞 方式 的 性 能 都 远 高 于 莫 观 阻 

原子 变量 相对 比较 简单 ， 但 对 于 复杂 一 些 的 数据 结构 和 算法 ， 非 阻 
塞 方式 往往 难于 实现 和 理解 ， 幸 运 的 是 ，Java 并 发 包 中 已 经 提供 了 一 些 
非 阻 寨 容 器 ， 我 们 只 需要 会 使 用 就 可 以 了 ， 比 如 : 


:ConcurrentLinkedQueue 和 ConcurrentLinkedDeque: 非 阻塞 并 发 队 
列 。 


ConcurrentSkipListMap 和 ConcurrentSkipListSet: 非 阻塞 并 发 Map 和 




















Seto 
这 些 容器 我 们 在 后 续 章 节 介 绍 。 


但 compareAndSet 是 怎么 实现 的 呢 ? 我 们 看 代码 : 





public final boolean compareAndSet(int expect, int update) { 
return unsafe.compareAndSwapInt(this, valueOffset, expect, update); 





它 调 用 了 unsafe 的 compareAndSwapInt 方 法 ，unsafe 是 什么 呢 ? 它 的 
类 型 为 sun.misc.Unsafe， 定 义 为 : 





private static final Unsafe unsafe = Unsafe.getUnsafe(); 





它 是 Sun 的 私有 实现 ， 从 名 字 看 ， 表 示 的 也 是 “不 安全 ”， 一 般 应 用 
程序 不 应 该 直接 使 用 。 原 理 上 ， 一 般 的 计算 机 系统 都 在 硬件 层次 上 直接 
文 持 CAS 指 令 ， 而 Java 的 实现 都 会 利用 这 些 特殊 指令 。 从 程序 的 角度 
看 ， 可 以 将 compareAndSet 视 为 计算 机 的 基本 操作 ， 直 接 接 纳 就 好 。 


3. 实 现 锁 


基于 CAS， 除 了 可 以 实现 乐观 非 阻 塞 算法 之 外 ， 还 可 以 实现 悲观 阻 
塞 式 算法 ， 比如 锁 。 实 际 上 ，Java 并 发 包 中 的 所 有 阻塞 式 工 具 、 容 器 、 
算法 也 都 是 基于 CAS 的 《不 过 ， 也 需要 一 些 别 的 支持 ) 。 怎 么 实现 锁 
呢 ? 我 们 演示 一 个 简单 的 例 于 ， 用 AtomicInteger 实 现 一 个 锁 MyLock， 
如 代码 清单 16-2 所 示 。 


代码 清单 16-2 ”使 用 AtomicInteger 实 现 锁 MyLock 








public class MyLock { 
private AtomicInteger status = new AtomicInteger(0); 
public void lock() { 
while(!status.compareAndSet(0, 1)) { 
Thread.yield( ); 
} 


} 

public void unlock() { 
status.compareAndSset (1, 0); 

} 


} 














在 MyLock 中 ， 使 用 status 表 示 锁 的 状态 ，0 表 示 未 锁定 ，1 表 示 锁 
定 ，lock () 、unlock () 使 用 CAS 方 法 更 新 ，lock () 只 有 在 更 新 成 功 
后 才 退 出 ， 实 现 了 阻塞 的 效果 ， 不 过 一 般 而 言 ， 这 种 阻塞 方式 过 于 消耗 
CPU， 我 们 后 续 章节 介绍 更 为 高 效 的 方式 。MyLock 只 是 用 于 演示 基本 
概念 ， 实 际 开发 中 应 该 使 用 Java 并 发 包 中 的 类 ， 如 ReentrantLock。 








16.1.2 ” ABA 问题 


使 用 CAS 方 式 更 新 有 一 个 ABA 问 题 。 该 问题 是 指 ， 假 设 当前 值 为 
A， 如 果 另 一 个 线程 先 将 A 修 改 成 B， 再 修改 回 成 A， 当 前 线程 的 CAS 操 
作 无 法 分 辨 当前 值 发 生 过 变化 。 


ABA 是 不 是 一 个 问题 与 程序 的 逻辑 有 关 ， 一 般 不 是 问题 。 而 如 果 确 
实 有 问题 ， 解 决 方法 是 使 用 AtomicStampedReference， 在 修改 值 的 同时 
只 有 值 和 时 间 惟 都 相同 才 进 行 修改 ， 其 CAS 方 法 声明 








public boolean compareAndSet( 
V expectedReference, V newReference, int expectedStamp, int newStamp) 





比如 : 





Pair pair = new Pair(100, 200); 

int stamp = 1; 

AtomicStampedReference<Pair> pairRef = new 
AtomicSstampedReference<Pair>(pair, stamp); 

int newStamp = 2; 

pairRef.compareAndSet(pair, new Pair(200, 200), stamp, newStamp); 





AtomicStampedReference 在 compareAndSet 中 要 同时 修改 两 个 值 : 一 
个 是 引用 ， 另 一 个 是 时 间 惟 。 它 怎么 实现 原子 性 呢 ? 实际 上 ， 内 部 
AtomicStampedReference 会 将 两 个 值 组 合 为 一 个 对 象 ， 修 改 的 是 一 个 
值 ， 我 们 看 代码 : 








public boolean compareAndSet(V expectedReference, V newReference, 
int expectedStamp, int newStamp) { 
Pair<V> current = pair; 


return 
expectedReference == current ,reference && 
expectedStamp == current.stamp && 
((newReference == Current,reference && 
newStamp == current .Stamp) || 
casPair(current, Pair.of(newReference, newStamp))); 





这 个 Pair 是 AtomicStampedReference 的 一 个 内 部 类 ， 成 员 包 括 引 用 和 
时 间 惟 ， 有 具体 定义 为 ; 





private static class Pair<T> { 
final T reference,; 
final int stamp; 
private Pair(T reference, int stamp) { 
this.reference = reference; 
this,stamp = stamp; 


static <T> Pair<T> of(T reference, int stamp) { 
return new Pair<T>(reference, stamp); 
} 
} 





AtomicStampedReference 将 对 引用 值 和 时 间 惟 的 组 合 比较 和 修改 转 
换 为 了 对 这 个 内 部 类 Pair 单 个 值 的 比较 和 修改 。 


16.1.3 小结 


本 节 介 绍 了 原子 变量 的 基本 用 法 以 及 背后 的 原理 CAS， 对 于 并 发 环 
境 中 的 计数 、 产 生 序 列 呈 等 需求 ， 应 该 使 用 原子 变量 而 非 锁 ，CAS 是 
Java 并 发 包 的 基础 ， 基 于 它 可 以 实现 高 效 的 、 乐 观 、 非 阻 竖 式 数据 结构 
和 算法 ， 它 也 是 并 发 包 中 锁 、 同 步 工 具 和 各 种 容器 的 基础 。 


16.2” 显 式 锁 


15.2 节 介绍 了 利用 synchronized 实 现 锁 ， 我 们 提 到 了 synchronized 的 
一 些 局 限 性 ， 本 节 探 讨 Java 并 发 包 中 的 显 式 锁 ， 它 可 以 解决 synchronized 
的 限制 。 


Java 并 发 包 中 的 显 式 锁 接 口 和 类 位 于 包 java.util.concurrent.locks 下 ， 
主要 接口 和 类 有 : 


: 销 接 口 Lock， 主 要 实现 类 是 ReentrantLock:; 








. 读 写 锁 接 口 ReadWriteLock， 主 要 实现 类 是 
ReentrantReadWfriteLock。 


本 节 主 要 介绍 接口 Lock 和 实现 类 ReentrantLock， 关 于 读 写 锁 ， 我 们 
后 续 章 节 介 绍 。 


16.2.1 接口 Lock 


显 式 锁 接口 Lock 的 定义 为 : 





public interface Lock { 
void lock(); 
void lockInterruptibly() throws InterruptedException; 
boolean tryLock(); 
boolean tryLock(long time, TimeUnit unit) throws InterruptedException,; 
void unlock(); 
Condition newCondition(); 








F 面 解释 一 下 。 


1) lock() /mnlock〈) : 就 是 普通 的 获取 锁 和 释放 锁 方 法 ， 
lock() 会 阻塞 直到 成 功 。 


2) lockInterruptibly () : 与 lock〈) 的 不 同 是 ， 它 可 以 响应 中 断 ， 
如 果 被 其 他 线程 中 断 了 ， 则 抛 出 InterruptedException。 


成 功 ， 返 回 true， 人 否则 返回 false。 


4) tryLock (long time，TimeUnit unit) : 先 尝试 获取 锁 ， 如 果 能 成 
功 则 立即 返回 true， 人 奋 则 阻塞 等 等， 但 等 竺 的 最 长 时 间 由 指定 的 参数 设 
置 ， 在 等 待 的 同时 响应 中 断 ， 如 果 发 生 了 中 断 ， 抛 出 
InterruptedException， 如 果 在 等 待 的 时 间 内 获得 了 锁 ， 返 回 true， 否 则 返 
回 false。 


5) newCondition: 新 建 一 个 条 件 ， 一 个 Lock 可 以 关联 多 个 条 件 ， 
关于 和 条件， 我 们 留待 16.3 节 介绍 。 


可 以 看 出 ， 相 比 synchronized， 显 式 锁 文 持 以 非 阻塞 方 式 获取 锁 、 
可 以 啊 应 中 断 、 可 以 限时 ， 这 使 得 它 灵活 得 多 。 





16.2.2 ”可 重 入 锁 ReentrantLock 


下 面 ， 先 介绍 ReentrantLock 的 基本 用 法 ， 然 后 重点 介绍 如 何 使 用 
tryLock 避 免 死 锁 。 


1. 基 本 用 法 


Lock 接 口 的 主要 实现 类 是 ReentrantLock， 它 的 基本 用 法 lock/unlock 
实现 了 与 syn-chronized 一 样 的 语义 ， 包 括 : 


可 重 入 ， 一 个 线程 在 持 有 一 个 锁 的 前 提 下 ， 可 以 继续 获得 该 锁 ; 
“可 以 解决 欧 态 条 件 问题 ; 
可 以 保证 内 存 可 见 性 。 


ReentrantLock 有 了 两 个 构造 方法 : 





public ReentrantLock() 
public ReentrantLock(boolean fair) 





参数 fair 表 示 是 否 保 证 公平 ， 不 指定 的 情况 下 ， 默 认为 false， 表 示 





不 保证 公平 。 所 谓 公平 是 指 ， 等 竺 时 间 最 长 的 线程 优先 获得 锁 。 保 证 公 
平 会 影响 性 能 ， 一 般 也 不 需要 ， 所 以 默认 不 保证 ， Synchronized 锁 也 是 
不 保证 公平 的 ，16.2.3 节 还 会 再 分 析 实 现 细节 。 


使 用 显 式 锁 ， 一 定 要 记得 调用 unlock。 一 般 而 言 ， 应 该 将 lock 之 后 
的 代码 包装 到 try 语 句 内 ， 在 finally 语 句 内 释放 锁 。 比 如 ， 使 用 
ReentrantLock 实 现 Counter， 代 码 可 以 为 : 





public class Counter { 
private final Lock lock = new ReentrantLock(); 
private volatile int count ， 
public void incr() { 
lock.1lock(); 
try { 
count++; 
} finally { 
lock.unlock(); 
} 


} 
public int getCount() { 
return count; 





2. 使 用 tryLock 避 人 免 死 锁 

使 用 tryLock 〈) ， 可 以 避免 死 锁 。 在 持 有 一 个 锁 获 取 另 一 个 锁 而 
获取 不 到 的 时 候 ， 可 以 释放 已 持 有 的 锁 ， 给 其 他 线程 获取 锁 的 机 会 ， 然 
后 重 试 获 取 所 有 锁 。 


我 们 来 看 个 例子 ， 银 行 账户 之 间 转 账 ， 用 类 Account 表 示 账 户 ， 如 
代码 清单 16-3 所 示 。 


代码 清单 16-3 ”表示 账户 的 类 Account 





public class Account { 
private Lock lock = new ReentrantLock( ) 
private volatile double money 
public Account(double initialMoney) { 
this.money = initialMoney;,; 


} 
public void add(double money) { 
lock.1lock(); 
try { 
this.money += money; 
} finally { 


lock.unlock(); 
} 


public void reduce(double money) { 
lock.1lock(); 


try { 
this.money -= money; 
} finally { 


lock.unlock(); 
} 


} 
public double getMoney() { 
return money; 


} 

void lock() { 
lock.1lock(); 

} 


void unlock() { 
lock.unlock(); 


boolean tryLock() { 
return lock.tryLock(); 
} 





Account 里 的 money 表 示 当 前 余额 ，add/reduce 用 于 修改 余额 。 在 账 
户 之 间 转 账 ， 需 要 两 个 账户 都 锁定 ， 如 果 不 使 用 tryLock， 而 直接 使 用 
lock， 则 代码 如 代码 清单 27-6 所 示 。 


代码 清单 16-4 转账 的 错误 写法 





public class AccountMgr { 
public static class NoEnoughMoneyException extends Exception {} 
public static void transfer(Account from, Account to, double money) 
throws NoEnoughMoneyException f{ 
from.1lock( ); 


try { 
to.1lock(); 
try { 


if(from.getMoney() >= money) { 
from.reduce(money); 
to.add(money); 

} else { 
throw new NoEnoughMoneyException( ); 


} 
} finally { 
to.unlock(); 


} 
} finally { 
from.unlock( ); 
} 


但 这 么 写 是 有 问题 的 ， 如 果 两 个 账户 都 同时 给 对 方 转 账 ， 都 先 获取 
0 则 会 发 生死 锁 。 我 们 写 段 代码 来 模拟 这 个 过 程 ， 如 代码 清 
单 16-5 所 示 。 


代码 清单 16-5 ”模拟 账户 转账 的 死 锁 过 程 








public static void simulateDeadLock() { 
final int accountNum = 10; 
final Account[] accounts = new Account[accountNum]; 
final Random rnd = new Random( ); 
for(int i = 0; i < accountNum; i++) 
accounts[i] = new Account(rnd.nextInt(10000)); 


int threadNum = 100; 
Thread[] threads = new Thread[threadNum]; 
for(int i = 0; i < threadNum; i++) { 
threads[i] = new Thread() { 
public void run() { 
int loopNum = 100; 
for(int k = 0; k < loopNum; k++) { 
int i rnd.nextInt(accountNum); 
int j = rnd.nextInt(accountNum); 
int money = rnd.nextInt(10); 
if(i != j) { 
try { 
transfer(accounts[i], accounts[j], money); 
} catch (NoEnoughMoneyException e) { 
} 
} 


} 


}; 
threads[i].start(); 





以 上 代码 创建 了 10 个 账户 ，100 个 线程 ， 每 个 线程 执行 100 次 循环 ， 
在 每 次 循环 中 ， 随 机 挑选 两 个 账户 进行 转账 。 在 笔者 的 计算 机 中 ， 每 次 
执行 该 段 代 码 都 会 发 生死 锁 。 读 者 可 以 更 改 这 些 数值 进行 试验 。 


我 们 使 用 tryLock 来 进行 修改 ， 先 定义 一 个 tryTransfer 方 法 ， 如 代码 
清单 16-6 所 示 。 


代码 清单 16-6 ”使 用 tryLock 演 试 转账 








public static boolean tryTransfer(Account from, Account to, double money) 
throws NoEnoughMoneyException 1{ 
if(from.tryLock()) { 
try { 


if(to.tryLock()) { 
try { 
if(from.getMoney() >= money) { 
from.reduce(money); 
to.add(money); 
} else { 
throw new NoEnoughMoneyException( ); 


return true; 
} finally { 

to.unlock(); 
} 


} 
} finally { 
from.unlock( ); 
} 


return false; 


} 





如 果 两 个 锁 都 能 够 获得 ， 且 转账 成 功 ， 则 返回 true， 人 否则 返回 
false。 不 管 怎 样 ， 结 束 都 会 释放 所 有 锁 。transfer 方 法 可 以 循环 调用 该 方 
法 以 避免 死 锁 ， 代 码 可 以 为 : 





public static void transfer(Account from, Account to, double money) 
throws NoEnoughMoneyException f{ 
boolean success = false,; 
do { 
success = tryTransfer(from, to, money); 
if(!success) { 
Thread.yield( ); 


} while (!success); 





除了 实现 Lock 接 口中 的 方法 ，ReentrantLock 还 有 一 些 其 他 方法 ， 通 
过 它们 ， 可 以 获取 关于 锁 的 一 些 信 息 ， 这 些 信息 可 以 用 于 监控 和 调试 目 
的 ， 有 具体 可 参看 API 文 档 ， 就 不 介绍 了 。 


16.2.3 ”ReentrantLock 的 实现 原理 


ReentrantLock 的 用 法 是 比较 简单 的 ， 它 是 怎么 实现 的 呢 ? 在 最 底 
层 ， 它 依赖 于 16.1 节 介绍 的 CAS 方 法 ， 另 外 ， 它 依赖 于 类 LockSupport 中 
的 一 些 方法 。 我 们 先 介 绍 Lock-Support。 


1.LockSupport 


类 LockSupport 也 位 于 包 java.util.concurrent.locks 下 ， 它 的 基本 方法 
有 : 





public static void park() 

public static void parkNanos(long nanos) 
public static void parkUntil(long deadline) 
public static void unpark(Thread thread) 





park 使 得 当前 线程 放弃 CPU， 进 入 等 待 状态 (WAITING) ， 操 作 系 
统 不 再 对 它 进 行 调度 ， 什 么 时 候 再 调度 呢 ? 有 其 他 线程 对 它 调 用 了 
unpark，unpark 使 参数 指定 的 线程 恢复 可 运行 状态 。 我 们 看 个 例子 : 








public static void main(String[] args) throws InterruptedException { 
Thread t = new Thread (){ 
public void run(){ 
LockSupport .park(); // 放 弃 CPU 
System.out.printiln("exit"); 





}; 

t.start(); // 启 动 子 线程 
Thread. sleep(1000); // 盯 
LockSupport ,unpark(t) 





[i 





眠 1 秒 确保 子 线程 先 运行 








上 述 例 子 中 ， 主 线程 启动 子 线 程 {， 线 程 t 启 动 后 调用 park， 放 弃 
CPU， 主 线程 睡眠 1 秒 以 确保 子 线程 已 执行 LockSupport.park () ， 调 用 
unpark， 线 程 {t 恢 复 运 行 ， 输 出 exit。 


park 不 同 于 Thread.yield () ，yield 只 是 告诉 操作 系统 可 以 先 让 其 他 
线程 运行 ， 但 自己 依然 是 可 运行 状态 ， 而 park 会 放弃 调度 资格 ， 使 线程 
进入 WAITING 状 态 。 


需要 说 明 的 是 ，park 是 响应 中 断 的 ， 当 有 中 断 发 生 时 ，park 会 返 
回 ， 线 程 的 中 断 状 态 会 被 设置 。 另 外 还 需要 说 明 ，park 可 能 会 无 缘 无 故 
地 返回 ， 程 序 应 该 重新 检查 park 等 待 的 条 件 是 否 满足 。 

park 有 两 个 变 体 : 


parkNanos: 可 以 指定 等 待 的 最 长 时 间 ， 参 数 是 相对 于 当前 时 间 的 
纳 秒 数 ; 


























:parkUntil: 可 以 指定 最 长 等 到 什么 时 候 ， 参 数 是 绝对 时 间 ， 是 相对 
于 纪元 时 的 坚 秒 数 。 


当 等 待 超时 的 时 候 ， 它 们 也 会 返回 。 


这 些 park 方 法 还 有 一 些 变 体 ， 可 以 指定 一 个 对 象 ， 表 示 是 由 于 该 对 
象 而 进行 等 竺 的 ， 以 便于 调试 ， 通 种 传 递 的 值 是 his， 比 如 : 











public static void park(Object blocker) 





LockSupport 有 一 个 方法 ， 可 以 返回 一 个 线程 的 blocker 对 象 : 





public static Object getBlocker(Thread t) 











这 些 park/unpark 方 法 是 怎么 实现 的 呢 ?” 与 CAS 方 法 一 样 ， 它 们 也 调 
用 了 Unsafe 类 中 的 对 应 方法 。Unsafe 类 最 终 调用 了 操作 系统 的 API， 从 
程序 员 的 角度 ， 我 们 可 以 认为 Lock-Support 中 的 这 些 方法 就 是 基本 操 
1 


2.AQS 


利用 CAS 和 LockSupport 提 供 的 基本 方法 ， 残 可 以 用 来 实现 
ReentrantLock 了 。 但 Java 中 还 有 很 多 其 他 并 发 工具 ， 如 
ReentrantReadWriteLock、Semaphore、CountDownLatch， 它 们 的 实现 有 
很 多 类 似 的 地 方 ， 为 了 复 用 代码 ，Java 提 供 了 一 个 抽象 类 
AbstractQueued-Synchronizer， 简 称 AQS， 它 简化 了 并 发 工具 的 实现 。 
AQS 的 整体 实现 比较 复杂 ， 我 们 主要 以 ReentrantLock 的 使 用 为 例 进行 简 


女儿 <Do。 


AQS 封 装 了 一 个 状态 ， 给 子 类 提供 了 查询 和 设置 状态 的 方法 : 











private volatile int state; 

protected final int getState() 

protected final void setState(int newState) 

protected final boolean compareAndSetState(int expect, int update) 





用 于 实现 锁 时 ，AQS 可 以 保存 锁 的 当前 持 有 线程 ， 提 供 了 方法 进行 


查询 和 设置 : 





private transient Thread exclusiveOwnerThread; 
protected final void setExclusiveOwnerThread(Thread t) 
protected final Thread getExclusiveOwnerThread() 








AQS 了 内 部 维护 了 一 个 等 竺 队列 ， 借 助 CAS 方 法 实现 了 无 阻塞 算法 进 
行 更 新 。 


下 面 ， 我 们 以 ReentrantLock 的 使 用 为 例 简要 介绍 AQS 的 原理 。 
3.ReentrantLock 


ReentrantLock 内 部 使 用 AQS， 有 三 个 内 部 类 : 





abstract static class Sync extends AbstractQueuedSynchronizer 
static final class NonfairSync extends Sync 
static final class FairSync extends Sync 





Sync 是 抽象 类 ，NonfairSync 是 fair 为 false 时 使 用 的 类 ，FairSync 是 
fire 为 true 时 使 用 的 类 。ReentrantLock 内 部 有 一 个 Sync 成 员 : 





private final Sync sync; 








在 构造 方法 中 sync 被 赋值 ， 比 如 : 





public ReentrantLock() { 
Sync = new NonfairSync(); 





我 们 来 看 ReentrantLock 中 的 基本 方法 lock/unlock 的 实现 。 先 看 lock 
方法 ， 代 码 为 : 





public void lock() { 
sync.1lock(); 





sync 默 认 类 型 是 NonfairSync，NonfairSync 的 lock 代 码 为 : 





final void lock() { 
If(compareAndSetState(0，1)) 
setExclusiveOwnerThread(Thread.currentThread( ) ) ; 
else 
acquire(1); 





ReentrantLock 使 用 state 表 示 是 否 被 锁 和 持 有 数量 ， 如 果 当 前 未 被 锁 
定 ， 则 立即 获得 锁 ， 否 则 调用 acquire (1) 获得 锁 。acquire 是 AQS 中 的 
方法 ， 代 码 为 : 








public final void acquire(int arg) { 
if(!tryAcquire(arg) && 
acquireQueued(addwaiter(Node.EXCLUSIVE), arg)) 
selfIinterrupt(); 





它 调用 tryAcquire 获 取 锁 ，tryAcquire 必 须 被 子 类 重 写 。NonfairSync 
的 实现 为 : 





protected final boolean tryAcquire(int acquires) { 
return nonfairTryAcquire(acquires); 
} 





nonfairTryAcquire 是 sync 中 实现 的 ， 代 码 为 : 





final boolean nonfairTryAcquire(int acquires) { 
final Thread current = Thread.currentThread(); 
int c = getState()， 
if(c == 0) { 
if(compareAndSetState(0, acquires)) { 
setExclusiveOwnerThread(current); 
return true; 


} 


else if(current == getExclusiveOwnerThread()) { 
int nextc = c + acquires,; 
if(nextc < 0) // overflow 
throw new Error("Maximum lock count exceeded"); 
setstate(nextc); 
return true; 


return false; 





这 段 代码 容易 理解 ， 如 果 未 被 锁定 ， 则 使 用 CAS 进 行 锁定 ;如 果 已 
被 当前 线程 锁定 ， 则 增加 锁定 次 数 。 如 果 tryAcquire 返 回 false， 则 AQS 
会 调用 : 





acquireQueued(addwaiter(Node.EXCLUSIVE), arg) 





其 中 ，addWaiter 会 新 建 一 个 节点 Node， 代 表 当 前 线程 ， 然 后 加 入 
内 部 的 等 待 队列 中 ， 限 于 篇 幅 ， 有 具体 代码 就 不 列 出 来 了 。 放 入 等 竺 队列 
后 ， 调 用 acquireQueued 演 试 获得 锁 ， 代 码 为 ; 








final boolean acquireQueued(final Node node, int arg) { 
boolean failed = true; 
try { 
boolean interrupted = false; 
for(;;) { 
final Node p = node.predecessor(); 
if(p == head && tryAcquire(arg)) { 
setHead(node); 
p.next = null; // help GC 
failed = false; 
return interrupted; 


} 

if(shouldParkAfterFailedAcquire(p, node) && 
parkAndCheckInterrupt()) 
interrupted = true; 


J 
} finally { 
if(failed) 
cancelAcquire(node); 














主体 是 一 个 死 循环 ， 在 每 次 循环 中 ， 首 先 检查 当前 节点 是 不 是 第 一 
个 等 待 的 节点 ， 如 果 是 且 能 获得 到 锁 ， 则 将 当前 节点 从 等 待 队列 中 移 除 
并 返回 ， 否 则 最 终 调用 LockSupport.park 放 弃 CPU， 进 入 等 待 ， 被 唤醒 
后 ， 检 碍 是 否 发 生 了 中 断 ， 记 录 中 断 标志 ， 在 最 终 方 法 返回 时 返回 中 断 
标志 。 如 果 发 生 过 中 断 ，acquire 方 法 最 终 会 调用 selfImnterrupt 方 法 设置 中 
断 标 志 位 ， 其 代码 为 : 











private static void selfInterrupt() { 
Thread.currentThread().interrupt(); 


} 








以 上 就 是 lock 方 法 的 基本 过 程 ， 能 获得 锁 就 立即 获得 ， 和 否则 加 入 等 
待 队列 ， 被 唤醒 后 检查 自己 是 否 是 第 一 个 等 待 的 线程 ， 如 果 是 且 能 获得 
锁 ， 则 返回 ， 否 则 继续 等 待 。 这 个 过 程 中 如 果 发 生 了 中 断 ，lock 会 记录 
中 断 标志 位 ， 但 不 会 提前 返回 或 抛 出 异常 。 


ReentrantLock 的 unlock 方 法 的 代码 为 : 

















public void unlock() { 
sync.release(1); 
} 





release 是 AQS 中 定义 的 方法 ， 代 码 为 : 





public final boolean release(int arg) { 
if(tryRelease(arg)) { 
Node h = head; 
if(h != null && h.waitSstatus != 0) 
unparkSuccessor(h); 
return true; 


return false; 


} 





tryRelease 方 法 会 修改 状态 释放 锁 ，unparkSuccessor 会 调用 
LockSupport.unpark 将 第 一 个 等 待 的 线程 唤醒 ， 有 具体 代码 就 不 列举 了 。 


FairSync 和 NonfairSync 的 主要 区 别 是 : 在 获取 锁 时 ， 即 在 tryAcquire 
方法 中 ， 如 果 当 前 未 被 锁定 ， 即 c==0，FairSync 多 了 一 个 检查 ， 如 下 : 








protected final boolean tryAcquire(int acquires) { 
final Thread current = Thread.currentThread(); 
int c = getState()， 
if(c == 0) { 
if(!hasQueuedPredecessors() && 
compareAndSetState(0, acquires)) { 
setExclusiveOwnerThread(current); 
return true; 
} 
} 











这 个 检查 是 指 ， 只 有 不 存在 其 他 等 待 时 间 更 长 的 线程 ， 它 才 会 尝试 
获取 锁 。 





这 样 保证 公平 不 是 很 好 吗 ? 为 什么 默认 不 保证 公平 呢 ? 保证 公平 整 
体 性 能 比较 低 ， 低 的 原因 不 是 这 个 检查 慢 ， 而 是 会 让 活跃 线程 得 不 到 
锁 ， 进 入 等 待 状态 ， 引 起 频繁 上 下 文 切 换 ， 降 低 了 整体 的 效率 ， 通常 
情况 下 ， 谁 先 运 行 关 系 不 大 ， 而 且 长 时 间 运 行 ， 从 统计 角度 而 言 ， 虽 然 
不 保证 公平 ， 也 基本 是 公平 的 。 需 要 说 明 是 ， 即 使 fair 参 数 为 true， 
ReentrantLock 中 不 带 参数 的 tryLock 方 法 也 是 不 保证 公平 的 ， 它 不 会 检 
但是 否 有 其 他 等 待 时 间 更 长 的 线程 。 


16.2.4 ”对 比 ReentrantLock 和 synchronized 


相 比 synchronized，ReentrantLock 可 以 实现 与 synchronized 相 同 的 语 
义 ， 而 且 文 持 以 非 阻塞 方式 获取 锁 ， 可 以 响应 中 断 ， 可 以 限时 ， 更 为 灵 
synchronized 的 使 用 更 为 简单 ， 写 的 代码 更 少 ， 也 更 不 容易 
百 。 


synchronized 代 表 一 种 声明 式 编程 思维 ， 程序 员 更 多 的 是 表达 一 种 
锁 代 表 一 种 命令 式 编程 思维 ， 程序 员 实 现 所 有 细节 。 

声明 式 编 程 的 好 处 除了 简单 ， 还 在 于 性 能 ， 在 较 新 版 本 的 JVM 上 ， 
ReentrantLock 和 synchronized 的 性 能 是 接近 的 ， 但 Java 编 译 器 和 虚拟 机 可 
以 不 断 优化 synchronized 的 实现 ， 比如 自动 分 析 synchronized 的 使 用 ， 对 
于 没有 锁 竞 争 的 场景 ， 目 动 省 略 对 锁 获 取 / 释 放 的 调用 。 


简单 总 结 下 ， 能 用 synchronized 束 用 synchronized， 不 满足 要 求 时 再 
考虑 Reentrant-Lock。 











16.3” 显 式 条 件 


16.2 亨 我 们 介绍 了 显 式 锁 ， 本 市 介绍 关联 的 显 式 条 件 ， 介 绍 其 用 法 
和 原理 。 显 式 条 件 在 不 同上 下 文中 也 可 以 被 称 为 条 件 变 量 、 条 件 队列 、 
或 条 件 ， 后 文 我 们 可 能 会 交 丛 使 用 。 





16.3.1 用 法 





锁 用 于 解决 竞 态 条 件 问题 ， 条 件 是 线程 间 的 协作 机 制 。 显 式 锁 与 
synchronized 相 对 应 ， 而 显 式 条 件 与 wait/notify 相 对 应 。wait/notify 与 
synchronized 配 合 使 用 ， 显 式 条 件 与 显 式 锁 配 合 使 用 。 条 件 与 锁 相 关 
联 ， 创 建 条 件 变量 需要 通过 显 式 锁 ，Lock 接 口 定 义 了 创建 方法 : 








Condition newCondition(); 











Condition 表 示 条 件 变 量 ， 是 一 个 接口 ， 它 的 定义 为 : 





public interface Condition { 
void await() throws InterruptedException; 
void awaitUninterruptibly(); 
long awaitNanos(long nanosTimeout) throws InterruptedException,; 
boolean await(long time, TimeUnit unit) throws InterruptedException; 
boolean awaitUntil(Date deadline) throws InterruptedException; 
void signal(); 
void signalAll(); 





await 对 应 于 Object 的 wait，signal 对 应 于 notify，signalAll 对 应 于 
notifyAll， 语 义 也 是 一 样 的 。 


与 Object 的 wait 方 法 类 似 ，await 也 有 几 个 限定 等 待 时 间 的 方法 ， 但 
功能 更 多 一 些 : 











// 等 待 时 间 是 相对 时 间 ， 如 果 由 于 等 待 超时 返回 ， 返 回 值 为 false， 和 否则 为 true 

boolean await(long time, TimeUnit unit) throws InterruptedException; 
// 等 待 时 间 也 是 相对 时 间 ， 但 参数 单位 是 纳 秒 ， 返 回 值 是 nanosTimeout 减 去 实际 等 待 的 时 间 
long awaitNanos(long nanosTimeout) throws InterruptedException,; 

// 等 待 时 间 是 绝对 时 间 ， 如 果 由 于 等 待 超时 返回 ， 返 回 值 为 false， 否 则 为 true 



























































boolean awaitUntil(Date deadline) throws InterruptedException; 





这 些 await 方 法 都 是 啊 应 中 断 的 ， 如 果 发 生 了 中 断 ， 会 抛 出 
InterruptedException， 但 中 断 标 志 位 会 被 清空 。Condition 还 定义 了 一 个 
不 啊 应 中 断 的 等 竺 方法: 





void awaitUninterruptibly(); 





该 方法 不 会 由 于 中 断 结束 ， 但 当 它 返回 时 ， 如 果 等 待 过 程 中 发 生 了 
中 断 ， 中 断 标 志 位 会 被 设置 。 


一 般 而 言 ， 与 Object 的 wait 方 法 一 样 ， 调 用 await 方 法 前 需要 先 获取 
锁 ， 如 果 没 有 锁 ， 会 抛 出 异常 llegalMonitorStateException 。 


await 在 进入 等 竺 队列 后 ， 会 释放 锁 ， 释 放 CPU， 当 其 他 线程 将 它 唤 
醒 后 ， 或 等 竺 超时 后 ， 或 发 生 中 断 异 浓 后 ， 它 都 需要 重新 获取 锁 ， 获 取 
锁 后 ， 才 会 从 await 方 法 中 退出 。 


另外 ， 与 Object 的 wait 方 法 一 样 ，await 返 回 后 ， 不 代表 其 等 待 的 条 
ee 了 ， 通 常 要 将 await 的 调用 放 到 一 个 循环 内 ， 只 有 条 件 满足 
后 才 退 出 。 


一 般 而 言 ，signal/signalAll 与 notify/notifyAl 一 样 ， 调 用 它们 需要 先 
获取 锁 ， 如 果 没 有 锁 ， 会 抛 出 异常 llegalMonitorStateException 。signal 
与 notify 一 样 ， 挑 选 一 个 线程 进行 唤醒 ，signalAll 与 notifyAl 一 样 ， 唤 醒 
所 有 等 待 的 线程 ， 但 这 些 线程 被 唤醒 后 都 需要 重新 竞争 锁 ， 获 取 锁 后 才 
会 从 await 调 用 中 返回 。 


ReentrantLock 实 现 了 newCondition 方 法 ， 通 过 它 ， 我 们 来 看 下 条 件 
的 基本 用 法 。 我 们 实现 与 15.3 节 类 似 的 例子 WaitThread， 一 个 线程 局 动 
后 ， 在 执行 一 项 操作 前 ， 等 待 主线 程 给 它 指 令 ， 收 到 指令 后 才 执 行 ， 示 
例 代 码 如 代码 清单 16-7 所 示 。 


代码 清单 16-7 使 用 显 式 条 件 进 行 协 作 的 示例 




















public class WaitThread extends Thread { 
private volatile boolean fire = false; 
private Lock lock = new ReentrantLock(); 


private Condition condition = lock.newCondition(); 
Q@Override 
public void run() { 
try { 
lock.1lock(); 
try { 
while (!fire) { 
condition.await(); 


} 
} finally { 
lock.unlock( ); 


System.out.printin("fired"); 

} catch (InterruptedException e) { 
Thread.interrupted(); 

} 


} 


public void fire() { 

lock.1lock(); 

try { 
this.fire = true; 
condition.signal(); 

} finally { 
lock.unlock(); 

} 


public static void main(String[] args) throws InterruptedException { 
WaitThread waitThread = new WaitThread ( ); 
waitThread.start(); 
Thread. sleep(1000); 
System.out.printin("fire"); 
waitThread ,fire(); 





需要 特别 注意 的 是 ， 不 要 将 signal/signalAll 与 notify/notifyAll 混 淆 ， 
notify/notifyAll 是 Object 中 定义 的 方法 ，Condition 对 象 也 有 ， 稍 不 注意 就 
会 误 用 。 比如 ， 对 上 面 例子 中 的 fe 方法 ， 可 能 会 写 为 : 





public void fire() { 

lock.1lock(); 

try { 
this.fire = true; 
condition.notify(); 

} finally { 
lock.unlock(); 

} 





写成 这 样 ， 编 译 器 不 会 报错 ， 但 运行 时 会 抛 出 
IllegalMonitorStateException， 因 为 notify 的 调用 不 在 synchronized 语 句 
内 。 同 样 ， 避 人 免 将 锁 与 synchronized 混 用 ， 那 样 非常 令 人 人 混淆， 比如 : 


有 


public void fire() { 
Synchronized(1Lock){ 
this.fire = true; 
condition.signal(); 





记 住 ， 显 式 条 件 与 显 式 锁 配 合 ，wait/notify 与 synchronized 配 合 。 


16.3.2 ”生产 者 /消费 者 模式 





在 15.3 三 ， 我 们 用 wait/notify 实 现 了 生产 者 /消费 者 模式 ， 我 们 提 到 
了 wait/notify 的 一 个 局 限 ， 它 只 能 有 一 个 条 件 等 待 队列 ， 分 析 等 每 条 件 
也 很 复杂 。 在 生产 者 /消费 者 模式 中 ， 其 实 有 两 个 条 件 ， 一 个 与 队列 满 
有 关 ， 一 个 与 队列 空 有 关 。 使 用 显 式 锁 ， 可 以 创建 多 个 条 件 等 待 队列 。 
0 我 们 用 显 式 锁 / 条 件 重新 实现 下 其 中 的 阻塞 队列 ， 如 代码 清单 16-8 
砂 。 


代码 清单 16-8 使 用 显 式 锁 /条 件 实现 的 阻 竖 队列 





static class MyBlockingQueue<E> { 
private Queue<E> queue = null; 
private int limit; 
private Lock lock = new ReentrantLock(); 
private Condition notFull = lock.newCondition(); 
private Condition notEmpty = lock.newCondition(); 
public MyBlockingQueue(int limit) { 
this.limit = limit; 
dueue = new ArrayDeque<>(1imit); 


public void put(E e) throws InterruptedException { 
lock.lockIinterruptibly(); 
try{ 
while (queue.size() == limit) { 
notFull.await( ); 


queue.add(e); 
notEmpty.signal(); 
}finally{ 
lock.unlock(); 
} 


public E take() throws InterruptedException { 
lock.lockIinterruptibly(); 
try{ 
while(queue.isEmpty()) { 
notEmpty .await( ); 
} 


E e = queue.poll(); 
notFull.signal(); 


return e; 
}finally{ 
lock.unlock( ); 
} 
} 
} 





上 述 代码 定义 了 两 个 等 竺 条件: 不 满 (notFull)〉、 不 空 
CnotEmpty) 。 在 put 方 法 中 ， 如 果 队 列 满 ， 则 在 notFull 上 等 待 ， 在 take 
方法 中 ， 如 果 队 列 空 ， 则 在 notEmpty 上 等 待 。put 操 作 后 通知 notEmpty， 
take 操 作 后 通知 notFul。 这 样 ， 代 码 更 为 清晰 易 读 ， 同 时 避免 了 不 必要 
的 唤醒 和 检查 ， 提 高 了 效率 。Java 并 发 包 中 的 类 ArrayBlockingQueue 束 
采用 了 类 似 的 方式 实现 。 








16.3.3 ”实现 原理 


理解 了 显 式 条 件 的 概念 和 用 法 ， 我 们 来 看 下 ReentrantLock 是 如 何 实 
现 它 的 ， 其 new-Condition 〈() 的 代码 为 : 





public Condition newCondition() { 
return sync.newCondition(); 





sync 是 ReentrantLock 的 内 部 类 对 象 ， 其 newCondition() 代码 为 : 





final Conditionobject newCondition() { 
return new ConditionObject(); 


} 





ConditionObject 是 AQS 中 定义 的 一 个 内 部 类 ， 它 的 实现 也 比较 复 
林 ， 我 们 通过 一 些 主 要 代码 来 简要 探讨 其 实现 原理 。ConditionObject 内 
部 也 有 一 个 队列 ， 表 示 条 件 等 待 队 列 ， 其 成 员 声 明 为 : 





// 条 件 队 列 的 头 节点 
private transient Node firstwaiter ; 
// 条 件 队列 的 尾 节 点 
private transient Node lastwaiter; 








ConditionObject 是 AQS 的 成 员 内 部 类 ， 它 可 以 直接 访问 AQS 中 的 数 
据 ， 比 如 AQS 中 定义 的 锁 等 待 队 列 。 我 们 看 下 主要 方法 的 实现 。 先 看 
await 方 法 ， 如 代码 清单 16-9 所 示 。 我 们 通过 添加 注释 解释 其 基本 思路 。 


代码 清单 16-9 _await 的 实现 代码 





public final void await() throws InterruptedException { 
// 如 果 等 待 前 中 断 标志 位 已 被 设置 ， 直 接 抛 出 异常 
if(Thread,.interrupted()) 
throw new InterruptedException(); 
//1. 为 当前 线程 创建 节点 ， 加 入 条 件 等 待 队 列 
Node node = addConditionwaitert): 
//2 .释放 持 有 的 锁 
int SavedState = fullyRelease(node); 
int interruptMode = 0; 
//3 .放弃 CPU， 进 行 等 待 ， 直 到 被 中 断 或 isOnSyncQueue 变 为 true 
/VisonSyncQueue 为 true， 表 示 节 点 被 其 他 线程 从 条 件 等 待 队列 
// 移 到 了 外 部 的 锁 等 待 队列 , 等 待 的 条 件 已 满足 
while (!isOnSyncQueue(node)) { 
LockSupport .park(this); 
if((interruptMode = checkIinterruptwhilewaiting(node)) != 0) 
break; 
























































} 

//4. 重 新 获取 锁 

if(acquireQueued(node, savedState) && interruptMode != THROW_IE) 
interruptMode = REINTERRUPT; 

if(node.nextwaiter != null) // clean up if cancelled 
unlinkCancelledwaiters(); 

//5. 处理 中 断 ， 抛 出 异常 或 设置 中 断 标 志 位 

if(interruptMode != 0) 
reportIinterruptAfterwait(interruptMode); 




































































awaitNanos 与 await 的 实现 是 基本 类 似 的 ， 区 别 主要 是 会 限定 等 待 的 
时 间 ， 具 体 就 不 列举 了 。 


signal 方 法 代码 为 : 





public final void signal() { 
// 验 证 当前 线程 持 有 锁 
if(!isHeldExclusively()) 
throw new IllegalMonitorStateException(); 
// 调 用 doSignal 唤 醒 等 待 队列 中 第 一 个 线程 
Node first = firstwaiter,; 
if(first != null) 
doSignal(first); 















































doSignal 的 代码 就 不 列举 了 ， 其 基本 风 辑 是 


1) 将 布点 从 条 件 等 待 队列 移 到 锁 等 竺 队列; 


2) 调用 LockSupportunpark 将 线程 唤醒 。 





16.3.4 小结 


本 节 介 绍 了 显 式 条 件 的 用 法 和 实现 原理 。 它 与 显 式 锁 配 合 使 用 ， 与 
waitnotify 相 比 ， 可 以 文 持 多 个 条 件 队 列 ， 代 码 更 为 易 读 ， 效 率 更 高 ， 
使 用 时 注意 不 要 将 signal/signalAll 误 写 为 notify/notifyAll。 


至 此 ， 关 于 并 发 包 的 基础 :原子 变量 和 CAS、 显 式 锁 和 条 件 ， 就 介 


绍 完了 ， 基 于 这 些 ，Java 并 发 包 还 提供 了 很 多 更 为 易 用 的 高 层 数据 结 
构 、 工 具 和 服务 ， 下 一 章 ， 我 们 介绍 一 些 并 发 容 露 。 





第 17 章 “并 发 容 盎 
本 章 ， 我 们 探讨 Java 并 发 包 中 的 容器 类 ， 有 具体 包括 : 
` 写 时 复制 的 List 和 Set; 
“ConcurrentHashMap:; 
:基于 SkipList 的 Map 和 Set; 


各 种 并 发 队列 。 
它们 都 有 什么 用 ? 如何 使 用 ? 与 普通 容器 类 相 比 ， 有 哪些 特点 ? 是 
如 何 实现 的 ? 本章 进行 详细 讨论 。 


17.1 写 时 复制 的 List 和 Set 


本 节 先 介绍 两 个 简单 的 类 : CopyOnWriteArrayList 和 
CopyOnWriteArraySet， 讨 论 它们 的 用 法 和 实现 原理 。 它 们 的 用 法 比较 
简单 ， 我 们 需要 理解 的 是 它们 的 实现 机 制 。Copy-On-Write 即 写 时 复 
制 ， 或 称 写 时 拷贝 ,这 是 解决 并 发 问题 的 一 种 重要 思路 。 


17.1.1 CopyOnWriteArrayList 


CopyOnWriteArrayList 实 现 了 List 接 口 ， 它 的 用 法 与 其 他 List( 如 
ArrayList) 基本 是 一 样 的 。CopyOnWriteArrayList 的 特点 如 下 : 


` 它 是 线程 安全 的 ， 可 以 被 多 个 线程 并 发 访问 ; 

: 它 的 迭代 器 不 支持 修改 操作 ， 但 也 不 会 抛 出 
ConcurrentModificationException:; 

` 它 以 原子 方式 支持 一 些 复合 操作 。 


我 们 在 15.2.3 节 提 到 过 基于 synchronized 的 同步 容器 的 几 个 问题 。 迭 
代 时 ， 需 要 对 整个 列表 对 象 加 锁 ， 否 则 会 抛 出 
ConcurrentModificationException，CopyOnWriteArrayList 没 有 这 个 问 
题 ， 运 代 时 不 需要 加 锁 。 


基于 synchronized 的 同步 容器 的 另 一 个 问题 是 复合 操作 ， 比 如 先 检 
查 再 更 新 ， 也 需要 调用 方 加 锁 ， 而 CopyOnWriteArrayList 直 接 文 持 两 个 
原子 方法 : 














// 不 存在 才 添 加 ， 如 果 添加 了 ， 返 回 true， 否 则 返回 false 
public boolean addIfAbsent(E e) 

// 批 量 添加 c 中 的 非 重复 元 素 ， 不 存在 才 添 加 ， 返 回 实际 添加 的 个 数 
public int addAllAbsent(Collection<? extends E> c) 























CopyOnWriteArrayList 的 内 部 也 是 一 个 数组 ， 但 这 个 数组 是 以 原子 
方式 被 整体 更 新 的 。 每 次 修改 操作 ， 都 会 新 建 一 个 数组 ， 复 制 原 数 组 的 


内 容 到 新 数组 ， 在 新 数组 上 进行 需要 的 修改 ， 然 后 以 原子 方式 设置 内 部 
的 数组 引用 ， 这 束 是 写 时 复制 。 


所 有 的 读 操 作 ， 都 是 先 拿 到 当前 引用 的 数组 ， 然 后 直接 访问 该 数 
组 。 在 读 的 过 程 中 ， 可 能 内 部 的 数组 引用 已 经 被 修改 了 ， 但 不 会 影响 读 
操作 ， 它 依旧 访问 原 数组 内 容 。 

换 句 话说 ， 数 组 内 容 是 只 读 的 ， 写 操作 都 是 通过 新 建 数 组 ， 然 后 原 
子 性 地 修改 数组 引用 来 实现 的 。 下 面 我 们 通过 代码 具体 介绍 (基于 Java 
7) ， 包 括 内 部 组 成 、 构 造 方法 、add 方 法 和 indexOf 方 法 。 


内 部 数组 声明 为 : 








private volatile transient Object[] array 





注意 : 它 声明 为 了 volatile， 这 是 必需 的 ， 以 保证 内 存 可 见 性 ， 即 保 
证 在 写 操作 更 改 之 后 读 操作 能 看 到 。 有 两 个 方法 用 来 访问 /设置 该 数 
组 : 





final Object[] getArray() { 
return array; 


final void setArray(Object[] a) { 
array = a; 
} 





在 CopyOnWriteArrayList 中 ， 读 不 需要 锁 ， 可 以 并 行 ， 读 和 写 也 可 
以 并 行 ， 但 多 个 线程 不 能 同时 写 ， 每 个 写 操作 都 需要 先 获 取 锁 。 
CopyOnWriteArrayList 内 部 使 用 Reentrant-Lock， 成 员 声 明 为 : 











transient final ReentrantLock lock = new ReentrantLock() 





默认 构造 方法 为 : 





public CopyonwriteArrayList() { 
setArray(new Object[0]); 





上 述 代 码 就 是 设置 了 一 个 空 数组 。 
add 方 法 的 代码 为 : 





public boolean add(E e) { 

final ReentrantLock lock = this.lock; 

lock.1lock(); 

try { 
Object[] elements = getArray(); 
int len = elements.1length; 
Object[] newElements = Arrays.copyof(elements, len + 1); 
newElements[len] = e; 
setArray(newElements); 
return true; 

} finally { 
lock.unlock(); 

} 


} 





上 述 代码 也 容易 理解 ，add 方 法 是 修改 操作 ， 整 个 过 程 需 要 被 锁 保 
护 ， 先 获取 当前 数组 elements， 然 后 复制 出 一 个 长 度 加 1 的 新 数组 
newElements， 在 新 数组 中 添加 元 素 ， 最 后 调用 setArray 原 子 性 地 修改 内 
部 数组 引用 。 


查找 元 素 indexOf 的 代码 为 : 








public int indexof(Object o) { 
Object[] elements = getArray(); 
return indexOof(o, elements, 0, elements.1length); 


} 





先 获取 当前 数组 elements， 然 后 调用 男 一 个 indexOf 进 行 查 找 ， 具 体 
代码 就 不 列举 了 。 这 个 indexOf 方 法 访问 的 所 有 数据 都 是 通过 参数 传递 
进来 的 ， 数 组 内 容 也 不 会 被 修改 ， 不 存在 并 发 问题 。 


每 次 修改 都 要 创建 一 个 新 数组 ， 然 后 复制 所 有 内 容 ， 这 听 上 去 是 一 
个 难以 令 人 接受 的 方案 ， 如 果 数 组 比较 大 ， 修 改 操 作 又 比较 频繁 ， 可 以 
想象 ，CopyOnWriteArrayList 的 性 能 是 很 低 的 。 事 实 确实 如 此 ， 
CopyOnWriteArrayList 不 适用 于 数组 很 大 有 旦 修改 频繁 的 场景 。 它 是 以 优 
ny 读 不 需要 同步 ， 性 能 很 高 ， 但 在 优化 读 的 同时 牺牲 

写 的 性 能 。 





之 前 我 们 介绍 了 保证 线程 安全 的 两 种 思路 : 一 种 是 锁 ， 使 用 
Synchronized 或 Reentrant-Lock; 另外 一 种 是 循环 CAS， 写 时 复制 体现 了 
保证 线程 安全 的 另 一 种 思路 。 锁 和 循环 CAS 都 是 控制 对 同一 个 资源 的 访 
问 冲突 ， 而 写 时 复制 通过 复制 资源 减少 冲突 。 对 于 绝 大 部 分 访问 都 是 
读 ， 且 有 大 量 并 发 线程 要 求 读 ， 只 有 个 别 线程 进行 号 ， 且 只 是 偶尔 写 的 
场合 ， 写 时 复制 就 是 一 种 很 好 的 解决 方案 。 


写 时 复制 是 一 种 重要 的 思维 ， 用 于 各 种 计算 机 程序 中 ， 比 如 操作 系 
统 内 部 的 进程 管理 和 内 存 管理 。 在 进程 管理 中 ， 子 进程 经 常 共享 父 进 
程 的 资源 ， 只 有 在 写 时 才 复 制 。 在 内 存 管理 中 ， 当 多 个 程序 同时 访问 同 
一 个 文件 时 ， 操 作 系 统 在 内 存 中 可 能 只 会 加 载 一 份 ， 只 有 程序 要 写 时 才 
会 复制 ， 分 配 目 己 的 内 存 ， 复 制 可 能 也 不 会 全 部 复制 ， 只 会 复制 写 的 位 
置 所 在 的 页 器 。 


























17.1.2 CopyOnWriteArraySet 


CopyOnWriteArraySet 实 现 了 Set 接 口 ， 不 包含 重复 元 素 ， 使 用 比较 
简单 ， 我 们 就 不 次 述 了 。 下 面 ， 主 要 介绍 其 内 部 组 成 ， 以 及 add 与 
contains 方 法 的 代码 。CopyOnWriteArraySet 内 部 是 通过 
CopyOnWriteArrayList 实 现 的 ， 其 成 员 声 明 为 : 





private final CopyonwriteArrayList<E> al; 








在 构造 方法 中 被 初始 化 ， 如 : 





public CopyonwriteArraySet() { 
al = new CopyOnWwriteArrayList<E>(); 
} 





其 add 方 法 代码 为 : 





public boolean add(E e) { 
return al.addIfAbsent(e); 
} 





add 方 法 就 是 调用 了 CopyOnWriteArrayList 的 addIfAbsent 方 法 。 


contains 方 法 代码 为 : 





public boolean contains(Object o) { 
return al.contains(o); 


} 





由 于 CopyOnWriteArraySet 是 基于 CopyOnWriteArrayList 实 现 的 ， 所 
以 与 之 前 介绍 过 的 Set 的 实现 类 如 HashSet/TreeSet 相 比 ， 它 的 性 能 比较 
低 ， 不 适用 于 元 素 个 数 特 别 多 的 集合 。 如 果 元 素 个 数 比 较 多 ， 可 以 考虑 
ConcurrentHashMap 或 ConcurrentSkipListSet 这 两 个 类 ， 我 们 稍 后 介绍 。 


简单 总 结 下 ，CopyOnWriteArrayList 和 和 CopyOnWriteArraySet 适 用 于 
读 远 多 于 写 、 集 合 不 太 大 的 场合 ， 它 们 采用 了 写 时 复制 ， 这 是 计算 机 程 
序 中 一 种 重要 的 思维 和 技术 。 


页 是 操作 系统 管理 内 存 的 一 个 单位 ， 有 具体 大 小 与 系统 有 关 ， 典 型 大 
小 为 4KB。 





17.2 ConcurrentHashMap 


本 节 介 绍 一 个 常用 的 并 发 容器 ConcurrentHashMap， 它 是 HashMap 
的 并 发 版 本 ， 与 HashMap 相 比 ， 它 有 如 下 特点 : 


并 发 安全 ; 
直接 文 持 一 些 原 子 复合 操作 ; 
` 文 持 高 并 肥 ， 读 操作 完全 并 行 ， 写 操作 文 持 一 定 程 度 的 并 行 ; 


与 同步 容器 Collections.synchronizedMap 相 比 ， 迭 代 不 用 加 锁 ， 不 
会 抛 出 ConcurrentModificationException; 


. 弱 一 致 性 。 
下 面 我 们 分 别 介绍 。 
1721 并发 安全 
需要 了 解 的 是 ，HashMap 不 是 并 发 安全 的 ， 在 并 发 更 新 的 情况 下 ， 


HashMap 可 能 出 现 死 循环 ， 占 满 CPU。 我 们 看 个 例子 ， 如 代码 清单 17-1 
所 示 。 


代码 清单 17-1 HashMap 死 循环 示例 








public static void unsafeConcurrentUpdate() { 
final Map<Integer, Integer> map = new HashMap<>(); 
for(int i = 0; i < 1000; i++) { 
Thread t = new Thread() { 
Random rnd = new Random(); 
@Override 
public void run() { 
for(int i = 0; i < 1000; i++) { 
map.put(rnd.nextInt(), 1); 


} 


}; 
t.start(); 





运行 上 面 的 代码 ， 在 笔者 的 计算 机 中 ， 无 论 是 Java 7 还 是 Java 8 环 
境 ， 每 次 都 会 出 现 死 循环 ， 占 满 CPU，。 


为 什么 会 出 现 死 循环 呢 ? 死 循环 出 现在 多 个 线程 同时 扩容 哈 希 表 的 
时 候 ， 不 是 同时 更 新 一 个 链表 的 时 候 ， 那 种 情况 可 能 会 出 现 更 新 丢失 ， 
但 不 会 死 循环 ， 有 具体 过 程 比 较 复 杂 ， 我 们 就 不 解释 了 。 关 于 Java 7 的 解 
释 感 兴趣 的 读者 可 以 参考 http://coolshell.cn/articles/9606.html 中 的 文章 。 
Java 8 对 HashMap 的 实现 进行 了 大 量 优化 ， 减 少 了 死 循环 的 可 能 ， 但 在 
扩容 的 时 候 还 是 可 能 有 和 死 循 环 。 


使 用 Collections.synchronizedMap 方 法 可 以 生成 一 个 同步 容器 ， 以 避 
倪 产 生死 循环 ， 蔡 换 第 一 行 代码 即 可 : 





final Map<Integer, Integer> map = new ConcurrentHashMap<>(); 





同步 容器 有 几 个 问题 : 
每 个 方法 都 需要 同步 ， 文 持 的 并 发 度 比 较 低 ; 
.对 于 迭代 和 复合 操作 ， 需 要 调用 方 加 锁 ， 使 用 比较 及 烦 ， 且 容易 


起 记 s 


ConcurrentHashMap 没 有 这 些 问题 ， 它 同样 实现 了 Map 接 口 ， 也 是 
基于 哈 希 表 实 现 的 ， 上 面 的 代码 蔡 换 第 一 行 即 可 : 





final Map<Integer, Integer> map = new ConcurrentHashMap<>() 





17.2.2 ”原子 复合 操作 


除了 Map 接 口 ，ConcurrentHashMap 还 实现 了 一 个 接口 
ConcurrentMap， 接 口 定 义 了 一 些 条 件 更 新 操作 ，Java 7 中 的 具体 定义 


NA 
. 





public interface ConcurrentMap<K, V> extends Map<K, V> 


《 
// 条 件 更 新 ， 如 果 Map 中 没有 key， 设 置 key 为 value， 返 回 原来 key 对 应 的 值 ， 














// 如 果 没 有 ， 返 回 nu11 

V putIfAbsent(K key, V value); 

// 条 件 删除 ， 如 果 Map 中 有 key， 且 对 应 的 值 为 value， 则 删除 ， 如 果 删 除了 ， 返 回 true， 
// 否 则 返回 false 
boolean remove(Object key, Object value); 

// 条 件 替 换 ， 如 果 Map 中 有 key， 且 对 应 的 值 为 oL1dvaLlue， 则 替换 为 newValue， 
// 如 果 蔡 换 了 ， 返 回 ture， 否 则 false 

boolean replace(K key, V oldValue, V newValue); 

// 条 件 蔡 换 ， 如 果 Map 中 有 key， 则 替换 值 为 value， 返 回 原来 key 对 应 的 值 ， 
// 如 果 原 来 没有 ， 返 回 null 

V replace(K key, V value); 





































































































Java 8 增加 了 几 个 默认 方法 ， 包 括 getOrDefault、forEach、 
compnuteIfAbsent、merge 等 ， 具 体 可 参见 API 文 要 ， 我 们 就 不 介绍 了 。 如 
果 使 用 同步 容器 ， 调 用 方 必须 加 锁 ， 而 Concurrent-HashMap 将 它们 实现 
为 了 原子 操作 。 实 际 上 ， 使 用 ConcurrentHashMap， 调 用 方 也 没有 办 法 
进行 加 锁 ， 它 没有 暴露 锁 接 口 ， 也 不 使 用 synchronized。 








17.2.3 ”高 并 发 的 基本 机 制 





ConcurrentHashMap 是 为 高 并 发 设计 的 ， 它 是 怎么 做 的 呢 ? 有 具体 实 
现 比 较 复杂 ， 我 们 简要 介绍 其 思路 ， 在 Java 7 中 ， 主 要 有 两 点 : 


读 不 需要 锁 。 





同步 容 堪 使 用 synchronized， 所 有 方法 竞争 同一 个 锁 ; 而 
ConcurrentHashMap 采 用 分 段 锁 技 术 ， 将 数据 分 为 多 个 段 ， 而 每 个 段 有 
一 个 独立 的 锁 ， 每 一 个 段 相 当 于 一 个 独立 的 哈 希 表 ， 分 段 的 依据 也 是 
哈 希 值 ， 无 论 是 你 存 键 值 对 还 是 根据 键 查找 ， 都 先 根据 键 的 哈 希 值 映射 
到 段 ， 再 在 段 对 应 的 哈 希 表 上 进行 操作 。 


采用 分 段 锁 ， 可 以 大 大 提高 并 用 上 度 ， 多 个 段 之 间 可 以 并 行 读 写 。 默 
认 情 况 下 ， 段 是 16 个 ， 不 过 ， 这 个 数字 可 以 通过 构造 方法 进行 设置 ， 如 
下 所 未: 











public ConcurrentHashMap(int initialCapacity, 
float loadFactor, int concurrencyLevel) 





concurrencyLevel 表 示 估 计 的 并 行 更 新 的 线程 个 数 ， 
ConcurrentHashMap 会 将 该 数 转 换 为 2 的 整数 次 属 ， 比 如 14 转 换 为 16，25 
转换 为 32 。 


在 对 每 个 段 的 数据 进行 读 写 时 ，ConcurrentHashMap 也 不 是 简单 地 
使 用 锁 进 行 同 步 ， 内 部 使 用 了 CAS。 对 一 些 写 采用 原子 方式 的 方法 ， 实 
现 比 较 复杂 ， 我 们 束 不 介绍 了 。 实 现 的 效果 是 ， 对 于 写 操 作 ， 需 要 获取 
锁 ， 不 能 并 行 ， 但 是 读 操作 可 以 ， 多 个 读 可 以 并 行 ， 写 的 同时 也 可 以 
读 ， 这 使 得 ConcurrentHashMap 的 并 行 度 远 高 于 同步 容器 。 


Java 8 对 ConcurrentHashMap 的 实现 进一步 做 了 优化 。 首 先 ， 与 
HashMap 的 改进 类 似 ， 在 哈 希 冲突 比较 严重 的 时 候 ， 会 将 单 向 链表 转化 
为 平衡 的 排序 二 叉 树 ， 提 高 查找 的 效率 ， 其 次 ， 锁 的 粒度 进一步 细 化 
了 ， 以 提高 并 行 性 ， 哈 希 表 数组 中 的 每 个 位 置 〈 指 同一 个 单 链 表 或 树 ) 
都 有 一 个 单独 的 锁 ， 有 具体 比较 复杂 ， 我 们 就 不 介绍 了 。 
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我 们 在 15.2.3 节 介绍 过 ， 使 用 同步 容器 ， 在 迭代 中 需要 加 锁 ， 人 否则 
可 能 会 抛 出 Concurrent-ModificationException。ConcurrentHashMap 没 有 
这 个 问题 ， 在 迭代 器 创建 后 ， 在 迭代 过 程 中 ， 如 果 另 一 个 线程 对 容 髓 进 
行 了 修改 ， 迭 代 会 继续 ， 不 会 抛 出 异 芝 。 

问题 是 ， 友 代 会 反映 其 他 线程 的 修改 吗 ? 还 是 像 
CopyOnWriteArrayList 一 样 ， 反 映 的 是 创建 时 的 副本 ? 答案 是 ， 都 不 
是 ! 我 们 看 个 例子 ， 如 代码 清单 17-2 所 示 。 


代码 清单 17-2 ”ConcurrentHashMap 的 迭代 示例 





public class ConcurrentHashMapIteratorDemo { 
public static void test() { 
final ConcurrentHashMap<String, String> map = 
new ConcurrentHashMap<>(); 
map.put("a", "abstract"); 
map.put("b", "basic"); 
Thread t1 = new Thread() { 
@Override 
public void run() 
for(Entry<String, String> entry : map.entrySet()) { 
try { 
Thread. sleep(1000); 


} catch (InterruptedException e) { 


System.out.println(entry.getKey() + "," + entry.getValue()); 
} 

} 
}; 
ti.start(); 
// 确保 线程 ti 启动 
try { 

Thread. sleep(100); 
} catch(InterruptedException e) { 


} 
map.put("c", "call"); 


public static void main(String[] args) { 
test(); 





t 司 动 后 ， 创 建 欠 代 顺 ， 但 在 迭代 输出 每 个 元 素 前 ， 移 睡眠 1 秒 ， 
主线 程 局 动 tL 后 ， 先 睡眠 一 下 ， 确 保 t1 先 运行 ， 然 后 给 map 增 加 了 一 个 
元 素 ， 程 序 输出 为 : 





a,abstract 
b,basic 
c,call 





上 述 代码 说 明和 迭代 器 反映 了 最 新 的 更 新 。 将 添加 语句 更 改 为 : 





map.put("g", "call"); 





会 发 现 程 友 输 出 为 : 





a,abstract 
b,basic 





这 说 明和 迭代 器 没有 反映 最 新 的 更 新 。 需 要 说 明 的 是 ， 这 是 Java 7 的 
输出 ，Java 8 和 Java 9 的 实现 不 太一 样 ， 输 出 也 不 太一 样 ， 但 也 有 相同 的 
问题 。 到 底 是 怎么 回 事 呢 ? 这 需要 我 们 理解 ConcurrentHashMap 的 弱 一 
致 性 。 


17.2.5” 弱 一 致 性 


ConcurrentHashMap 的 友 代 堪 创 建 后 ， 就 会 按照 哈 希 表 结 构 允 历 
个 元 素 ， 但 在 过 有 历 过 程 中 ， 内 部 元 背 可 能 会 发 生变 化 ， 如 果 变 化 发 生 在 
己 壳 历 过 的 部 分 ， 友 代 器 耽 不 会 反映 出 来 ， 而 如 果 变 化 发 生 在 未 过 有 历 过 
的 部 分 ， 磊 代 器 束 会 发 现 并 反映 出 来 ， 这 就 是 弱 一 致 性 。 


类 似 的 情况 还 会 出 现在 ConcurrentHashMap 的 另 一 个 方法 : 





// 批 量 添加 m 中 的 键 值 对 到 当前 Map 
public void putAll(Map<? extends K, ? extends V> m) 











该 方法 并 非 原 子 操 作 ， 而 是 调用 put 方 法 逐个 元 素 进 行 添加 的 ， 在 
该 方法 没有 结束 的 时 候 ， 部 分 修改 效果 束 会 体现 出 来 。 


| 下 


本 市 介绍 了 ConcurrentHashMap， 它 是 并 发 版 的 HashMap， 通 过 降 
低 锁 的 粒度 和 CAS 等 实现 了 高 并 发 ， 文 持原 子 条 件 更 新 操作 ， 不 会 抛 出 
ConcurrentModificationException， 实 现 了 弱 一 致 性 。 


Java 中 没有 并 发 版 的 HashSet， 但 可 以 通过 
Collections.newSetFromMap 方 法 基于 Con-currentHashMap 构 建 一 个 。 


我 们 知道 HashMap/HashSet 基 于 哈 希 ， 不 能 对 元 素 排 序 ， 对 应 的 可 
排序 的 容器 类 是 TreeMap/TreeSet， 并 发 包 中 可 排序 的 对 应 版 本 不 是 基于 
树 ， 而 是 基于 Skip List (跳跃 表 ) ， 类 分 别 是 ConcurrentSkipListMap 和 
ConcurrentSkipListSet， 它 们 到 底 是 什么 呢 ? 让 我 们 下 节 讨 论 。 














17.3 ”基于 跳 表 的 Map 和 Set 


Java 并 发 包 中 与 TreeMap/TreeSet 对 应 的 并 发 版 本 是 
ConcurrentSkipListMap 和 Concurrent-SkipListSet， 本 节 束 来 简要 探讨 这 
两 个 类 ， 先 介绍 基本 概念 ， 然 后 介绍 基本 实现 原理 。 


17.3.1 基本 概念 


我 们 知道 ，TreeSet 是 基于 TreeMap 实 现 的 ， 与 此 类 似 ， 
ConcurrentSkipListSet 也 是 基于 ConcurrentSkipListMap 实 现 的 ， 所 以 我 们 
主要 介绍 ConcurrentSkipListMap 。 


ConcurrentSkipListMap 是 基于 SkipList 实 现 的 ，SkipList 称 为 跳跃 表 
或 跳 表 ， 是 一 种 数据 结构 ， 稍 后 我 们 会 进一步 介绍 。 并 发 版 本 为 什么 采 
用 跳 表 而 不 是 树 呢 ? 原因 也 很 简单 ， 因 为 跳 表 更 易于 实现 高 效 并 发 算 
法 。ConcurrentSkipListMap 有 如 下 特点 。 


1) 没有 使 用 锁 ， 所 有 操作 都 是 无 阻 窄 的， 所 有 操作 都 可 以 并 行 ， 
包括 写 ， 多 线程 可 以 同时 写 。 


2) 与 ConcurrentHashMap 类 似 ， 和 迭代 右 不 会 殷 出 
ConcurrentModificationException， 是 弱 一 臻 的， 迭代 可 能 反映 最 新 修改 
也 可 能 不 反映 ， 一 些 方法 如 putAll、dlear 不 是 原子 的 。 


3) 与 ConcurrentHashMap 类 似 ， 同 样 实 现 了 ConcurrentMap 接 口 ， 
文 持 一 些 原 子 复 合 操作 。 


4) 与 TreeMap 一 样 ， 可 排序 ， 默 认 按 键 的 目 然 顺 序 ， 也 可 以 传递 比 
较 器 自 定义 排序 ， 实 现 了 SortedMap 和 NavigableMap 接 口 。 


看 段 简单 的 使 用 代码 : 




















public static void main(String[] args) { 
Map<String, String> map = new ConcurrentSkipListMap<>( 
Collections.reverseOrder()); 
map.put("a", "abstract"); 
map.put("c", "call"); 


map.put("b", "basic"); 
System.out.printin(map.toString()); 





程序 输出 为 : 





{c=call, b=basic, a=abstract} 





表示 是 有 序 的 。 


我 们 之 前 介绍 过 ConcurrentSkipListMap 的 大 部 分 方法 ， 有 序 的 方法 
与 TreeMap 是 类 似 的 ， 原 子 复合 操作 与 ConcurrentHashMap 是 类 似 的 ， 此 
处 不 再 歼 述 。 


需要 说 明 的 是 ConcurrentSkipListMa 的 size 方 法， 与 大 多 数 容 器 实现 
不 同 ， 这 个 方法 不 是 常量 操作 ， 它 需要 遍历 所 有 元 素 ， 复 杂 度 为 
O (CN) ， 而 且 遍 历 结 束 后 ， 元 素 个 数 可 能 已 经 变 了 。 一 般 而 言 ， 在 并 
发 应 用 中 ， 这 个 方法 用 处 不 大 。 下 面 我 们 主要 介绍 其 基本 实现 原理 。 




















17.3.2 ”基本 实现 原理 





我 们 先 来 介绍 跳 表 的 结构 ， 跳 表 是 基于 链表 的 ， 在 链表 的 基础 上 加 
人 我 们 通过 一 个 简单 的 例子 来 说 明 。 假 定 容器 中 包含 
[下 元 素 : 





3，6，7，9，12，17，19，21，25，26 





对 Map 来 说 ， 这 些 值 可 以 视 为 键 。ConcurrentSkipListMap 会 构造 类 
似 图 17-1 所 示 的 跳 表 结构 。 


null 


null 





图 17-1 ” 跳 表 结构 示例 
最 下 面 一 层 就 是 最 基本 的 单 向 链表 ， 这 个 链表 是 有 序 的 。 虽 然 是 有 

















序 的 ， 但 我 们 知道 ， 与 数组 不 同 ， 链 表 不 能 根据 索引 直接 定位 ， 不 能 i 
行 一 分 但 撒 s 


为 了 快速 查找 ， 跳 表 有 多 层 索 引 结 构 ， 这 个 例子 中 有 两 屋 ， 第 一 层 
有 5 个 节点 ， 第 二 层 有 2 个 节点 。 高 层 的 索引 节点 一 定 同 时 是 低层 的 索引 
节点 ， 比如 9 和 21。 高 层 的 索引 节点 少 ， 低 层 的 多 。 统 计 概 率 上 ， 第 一 
层 索引 节点 是 实际 元 素数 的 112， 第 二 层 是 第 一 层 的 112， 逐 层 减 半 ， 但 
这 不 是 绝对 的 ， 有 随机 性 ， 只 是 大 致 如 此 。 每 个 索引 节点 有 两 个 指针 : 
一 个 辐 右 ， 指 同 下 一 个 同 层 的 索引 节点 ; 另 一 个 同 下 ， 指 同 下 一 层 的 索 
引 节 点 或 基本 链表 节点 。 


有 了 这 个 结构 ， 就 可 以 实现 类 似 二 分 查找 了 。 查找 元 素 总 是 从 最 
高 层 开始 ， 将 竺 得 值 与 下 一 个 索引 市 点 的 值 进行 比较 ， 如 果 大 于 索引 区 
扩 ， 束 同 石 移动 ， 继 续 比 较 ， 如 果 小 于 索引 节 扣 ， 则 向 下 移动 到 下 一 层 
进行 比较 。 图 17-2 所 示 的 两 条 线 展示 了 查找 值 19 和 8 的 过 程 。 









































图 17-2 ”在 跳 表 中 碍 找 的 示例 

对 于 值 19， 查 找 过 程 是 : 

1) 与 9 相 比 ， 大 于 9; 

2) 问 右 与 21 相 比 ， 小 于 21; 

3) 同 下 与 17 相 比 ， 大 于 17; 

4) 回 右 与 21 相 比 ， 小 于 21; 

5) 向 下 与 19 相 比 ， 找 到 。 

对 于 值 8， 查 找 过 程 是 : 

1) 与 9 相 比 ， 小 于 9; 

2) 问 下 与 6 相 比 ， 大 于 6; 

3) 向 右 与 9 相 比 ， 小 于 9; 

4) 问 下 与 7 相 比 ， 大 于 7; 

5) 向 右 与 9 相 比 ， 小 于 9， 不 能 再 向 下 ， 没 找到 。 

这 个 结构 是 有 序 的 ， 碍 找 的 性 能 与 二 又 树 类 似 ， 复 杂 度 是 
O (log CN) ) 。 不 过 ， 这 个 结构 是 如 何 构建 起 来 的 呢 ? 与 二 又 树 类 
似 ， 这 个 结构 是 在 更 新 过 程 中 进行 保持 的 ， 保 存 元 素 的 基本 思路 是 : 
_1) 先 保存 到 基本 链表 ， 找 到 待 插入 的 位 置 ， 找 到 位 置 后 ， 插 入 基 


链 











2) 更 新 索引 层 。 


对 于 索引 更 新 ， 随 机 计算 一 个 数 ， 表 示 为 该 元 素 最 高 建 儿 层 索 引 ， 
一 层 的 概率 为 12， 二 层 的 概率 为 4， 三 层 的 概率 为 118， 以 此 类 推 。 然 
后 从 最 高 层 到 最 低层 ， 在 每 一 层 ， 为 该 元 素 建 立 索 引 节点 ， 建 立 索 引 节 
点 的 过 程 也 是 先 碍 找 位 置 ， 再 插入 。 





























对 于 删除 元 素 ，ConcurrentSkipListMap 不 是 直接 进行 真正 删除 ， 而 
是 为 了 避免 并 发 冲突 ， 有 一 个 复杂 的 标记 过 程 ， 在 内 部 过 历 元 素 的 过 程 
中 进行 真正 删除 。 


以 上 我 们 只 是 介绍 了 基本 思路 ， 为 了 实现 并 发 安全 、 高 效 、 无 锁 非 
阻塞 ，Concurrent-SkipListMap 的 实现 非常 复杂 ， 有 具体 我 们 就 不 探讨 了 ， 
感 兴趣 的 读者 可 以 参考 其 源 合 ， 其 中 提 到 了 多 篇 学 术 论 文 ， 论 文中 摘 述 
了 它 参 考 的 一 些 算 法 。 对 于 常见 的 操作 ， 如 
get/put/remove/containsKey，ConcurrentSkipListMap 的 复杂 度 都 是 
O (log CN) ) 。 


上 面 介 绍 的 SkipList 结 构 是 为 了 便于 并 发 操作 的 ， 如 果 不 需要 并 
发 ， 可 以 使 用 另 一 种 更 为 高 效 的 结构 ， 数 据 和 所 有 层 的 索引 放 到 一 个 节 
null 


点 中 ， 如 图 17-3 所 示 。 
[= | 加 
| 所 | 本 | | | = | | i 


图 17-3 ”数据 和 索引 都 在 一 个 节点 中 的 跳 表 


对 于 一 个 元 素 ， 只 有 一 个 节点 ， 只 是 每 个 节 点 的 索引 个 数 可 能 不 
同 ， 在 新 建 一 个 节点 时 ， 使 用 随机 算法 决定 它 的 索引 个 数 。 平 均 而 言 ， 
1/2 的 元 素 有 两 个 索引 ，L/4 的 元 素 有 三 个 索引 ， 以 此 类 推 。 


简单 总 结 下 ，ConcurrentSkipListMap 和 ConcurrentSkipListSet 基 于 跳 
表 实 现 ， 有 序 ， 无 锁 非 阻塞 ， 完 全 并 行 ， 主 要 操作 复杂 上 度 为 
O (log CN) ) 。 
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null 
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17.4 并 发 队列 

本 节 ， 我 们 介绍 Java 并 发 包 中 的 各 种 队列 。Java 并 发 包 提 供 了 丰 宇 
的 队列 类 ， 可 以 简单 分 为 以 下 几 种 。 

:无 锁 非 阻 堵 并 发 队列 :ConcurrentLinkedQueue 和 


ConcurrentLinkedDeque。 


.普通 阻塞 队列 : 基于 数组 的 ArrayBlockingQueue， 基 于 链表 的 
LinkedBlockingQueue 和 LinkedBlockingDeque。 


.优先 级 阻塞 队列 : PriorityBlockingQueue。 

: 延 时 阳 寨 队列 : DelayQueue。 

.其 他 阻塞 队列 :SynchronousQueue 和 LinkedTransferQueue。 

无 锁 非 阻塞 是 指 ， 这 些 队 列 不 使 用 锁 ， 所 有 操作 总 是 可 以 立即 执 
行 ， 主 要 通过 循环 CAS 实 现 并 发 安全 。 阻 塞 队列 是 指 ， 这 些 队 列 使 用 锁 


和 条 件 ， 很 多 操作 都 需要 先 获取 锁 或 满足 特定 条 件 ， 获 取 不 到 锁 或 等 待 
条 件 时 ， 会 等 等 〈 即 阻 窒 ) ， 获 取 到 锁 或 条 件 满足 再 返回 。 








这 些 队 列 和 迭代 都 不 会 抛 出 ConcurrentModificationException， 都 是 弱 
一 致 的 ， 后 面 就 不 单独 强调 了 。 下 面 ， 我 们 来 简要 介绍 每 类 队列 的 用 
途 、 用 法 和 基本 实现 原理 。 


17.4.1 无 锁 非 阻塞 并 友 队 列 


有 两 个 无 锁 非 阻塞 队列 : ConcurrentLinkedQueue 和 
ConcurrentLinkedDeque， 它 们 适用 于 多 个 线程 并 发 使 用 一 个 队列 的 场 
合 ， 都 是 基于 链表 实现 的 ， 都 没有 限制 大 小 ， 是 无 界 的 ， 与 
ConcurrentSkipListMap 类 似 ， 它 们 的 size 方 法 不 是 一 个 常量 运算 ， 不 过 
这 个 方法 在 并 发 应 用 中 用 处 也 不 大 。 


ConcurrentLinkedQueue 实 现 了 Queue 接 口 ， 表 示 一 个 先进 先 出 的 队 








列 ， 从 尾部 入 队 ， 从 头 部 出 队 ， 内 部 是 一 个 单 癌 链表 。 
ConcurrentLinkedDeque 实 现 了 Deque 接 口 ， 表 示 一 个 双 端 队列 ， 在 两 端 
都 可 以 入 队 和 出 队 ， 内 部 是 一 个 双 加 链表。 它们 的 用 法 类 似 于 Linked- 
List， 我 们 就 不 闭 述 了 。 


这 两 个 类 最 基础 的 原理 是 循环 CAS，ConcurrentLinkedQueue 的 算法 
基于 一 篇 论文 《Simple，Fast，and Practical Non-Blocking and Blocking 
Concurrent Queue Algorithm》 

(https://www.research.ibm.com/people/m/michael/podc-1996.pdf ) 。 
ConcurrentLinkedDeque 扩 展 了 Con-currentLinkedQueue 的 技术 ， 但 它们 
的 具体 实现 都 非常 复杂 ， 我 们 就 不 探讨 了 。 





17.4.2 ”普通 阻塞 队列 


除了 刚 介 绍 的 两 个 队列 ， 其 他 队列 都 是 阻塞 队列 ， 都 实现 了 接口 
BlockingQueue， 在 入 队 / 出 队 时 可 能 等 待 ， 主 要 方法 有 : 














// 入 队 ， 如 果 队 列 满 ， 等 待 直到 队列 有 空间 

void put(E e) throws InterruptedException,; 
// 出 队 ， 如 果 队 列 空 ， 等 待 直到 队列 不 为 空 ， 返 回头 部 元 素 
E take() throws InterruptedException; 
// 入 队 ， 如 果 队 列 满 ， 最 多 等 待 指定 的 时 间 ， 如 果 超 时 还 是 满 ， 返 回 false 

boolean offer(E e, long timeout, TimeUnit unit) throws InterruptedException,; 
// 出 队 ， 如 果 队 列 空 ， 最 多 等 待 指 定 的 时 间 ， 如 果 超 时 还 是 空 ， 返 回 null 

E poll(long timeout, TimeUnit unit) throws InterruptedException; 
















































































普通 阻 窗 队列 是 第 用 的 队列 ， 常 用 于 生产 者 /消费 者 模式 。 


ArrayBlockingQueue 和 LinkedBlockingQueue 都 实现 了 Queue 接 口 ， 
表示 先进 先 出 的 队列 ， 尾 部 进 ， 头 部 出 ， 而 LinkedBlockingDeque 实 现 了 
Deque 接 口 ， 是 一 个 双 端 队列 。 


ArrayBlockingQueue 是 基于 循环 数组 实现 的 ， 有 界 ， 创 建 时 需要 指 
定 大 小 ， 且 在 运行 过 程 中 不 会 改变 ， 这 与 我 们 在 容器 类 中 介绍 的 
ArrayDeque 是 不 同 的 ，ArrayDeque 也 是 基于 循环 数组 实现 的 ， 但 是 是 无 
界 的 ， 会 自动 扩展 。 


LinkedBlockingQueue 是 基于 单 回 链表 实现 的 ， 在 创建 时 可 以 指定 最 
大 长 度 ， 也 可 以 不 指定 ， 默 认 是 无 限 的 ， 节 点 都 是 动态 创建 的 。 








LinkedBlockingDeque 与 LinkedBlocking-Queue 一 样 ， 最 大 长 度 也 是 在 创 
建 时 可 选 的 ， 默 认 无 限 ， 不 过 ， 它 是 基于 双 同 链表 实现 的 。 


内 部 ， 它 们 都 是 使 用 显 式 锁 ReentrantLock 和 显 式 条 件 Condition 实 现 














ArrayBlockingQueue 的 实现 很 直接 ， 有 一 个 数组 存储 元 素 ， 有 两 个 
索引 表示 头 和 尾 ， 有 一 个 变量 表示 当前 元 素 个 数 ， 有 一 个 锁 保 护 所 有 访 
问 ， 有 “不 满 *? 和 “不 空 ”两 个 条 件 用 于 协作 ， 实 现 思路 与 我 们 在 15.3.3 节 
实现 的 类 似 ， 就 不 闭 述 了 。 


与 ArrayBlockingQueue 类 似 ，LinkedBlockingDeque 也 是 使 用 一 个 锁 
和 两 个 条 件 ， 使 用 锁 保 护 所 有 操作 ， 使 用 “不 满 ” 和 "不 空 ? 两 个 条 件 。 
LinkedBlockingQueue 稍 微 不 同 ， 因 为 它 使 用 链表 ， 且 只 从 头 部 出 队 、 从 
尾部 入 队 ， 它 做 了 一 些 优 化 ， 使 用 了 两 个 锁 ， 一 个 保护 头 部 ， 一 个 保护 
尾部 ， 每 个 锁 关 联 一 个 条 件 。 

















17.4.3 ”优先 级 阻塞 队列 


普通 阻塞 队列 是 先进 先 出 的 ， 而 优先 级 队列 是 按 优先 级 出 队 的 ， 优 
先 级 高 的 先 出 ， 我 们 在 容器 类 中 介绍 过 优先 级 队列 PriorityQueue 及 其 背 
后 的 数据 结构 堆 。Priority-BlockingQueue 是 PriorityQueue 的 并 发 版 本 ， 
与 PriorityQueue 一 样 ， 它 没有 大 小 限制 ， 是 无 界 的 ， 内 部 的 数组 大 小 会 
动态 扩展 ， 要 求 元 素 要 么 实现 Comparable 接 口 ， 要 么 创建 Priority- 
BlockingQueue 时 提供 一 个 Comparator 对 象 。 








与 PriorityQueue 的 区 别 是 ，PriorityBlockingQueue 实 现 了 
BlockingQueue 接 口 ， 在 队列 为 空 时 ，take 方 法 会 阻塞 等 待 。 另 外 ， 
PriorityBlockingQueue 是 线程 安全 的 ， 它 的 基本 实现 原理 与 PriorityQueue 
是 一 样 的 ， 也 是 基于 堆 ， 但 它 使 用 了 一 个 锁 ReentrantLock 保 护 所 有 访 
问 ， 使 用 了 一 个 条 件 协调 阻 考 等 待 。 








17.4.4 延 时 阻塞 队列 


延 时 阻塞 队列 DelayQueue 是 一 种 特殊 的 优先 级 队列 ， 它 是 无 界 的 。 
它 要 求 每 个 元 素 都 实现 Delayed 接 口 ， 该 接口 的 声明 为 : 





public interface Delayed extends Comparable<Delayed> { 
long getDelay(TimeUnit unit); 
} 





Delayed 扩 展 了 Comparable 接 口 ， 也 就 是 说 ，DelayQueue 的 每 个 元 
系 都 是 可 比较 的 ， 它 有 一 个 额外 方法 getDelay 返 回 一 个 给 定时 间 单 位 unit 
的 整数 ， 表 示 再 延迟 多 长 时 间 ， 如 果 小 于 等 于 0， 则 表示 不 再 延迟 。 


DelayQueue 可 以 用 于 实现 定时 任务 ， 它 按 元 素 的 延 时 时 间 出 队 。 它 
的 特殊 之 处 在 于 ， 只 有 当 元 素 的 延 时 过 期 之 后 才能 被 从 队列 中 拿 走 ， 也 
就 是 说 ，take 方 法 总 是 返回 第 一 个 过 期 的 元 素 ， 如 果 没 有 ， 则 阻 紧 等 
待 。 

















DelayQueue 是 基于 PriorityQueue 实 现 的 ， 它 使 用 一 个 锁 
ReentrantLock 保 护 所 有 访问 ， 使 用 一 个 条 件 available 表 示 头 部 是 侣 有 元 
素 ， 当 头 部 元 素 的 延 时 未 到 时 ，take 操 作 会 根据 延 时 计算 需 睡 眠 的 时 
间 ， 然 后 睡眠 ， 如 果 在 此 过 程 中 有 新 的 元 素 入 队 ， 且 成 为 头 部 元 素 ， 则 
阻塞 睡眠 的 线程 会 被 提前 唤醒 然后 重新 检查 。 这 是 基本 思路 ， 
As 以 减少 不 必要 的 唤醒 ， 有 具体 我 们 就 不 探 
讨 了 。 








17.4.5 ”其 他 阻塞 队列 


Java 并 发 包 中 还 有 两 个 特殊 的 阻塞 队列 : SynchronousQueue 和 


LinkedTIransferQueue。 


SynchronousQueue 与 一 般 的 队列 不 同 ， 它 不 算 一 种 真正 的 队列 ， 没 
有 存储 元 素 的 空间 ， 连 存储 一 个 元 素 的 空间 都 没有 。 它 的 入 队 操作 要 等 
待 另 一 个 线程 的 出 队 操作 ， 反 之 亦 然 。 如 果 没 有 其 他 线程 在 等 待 从 队列 
中 接收 元 素 ，put 操 作 就 会 等 待 。take 操 作 需 要 等 待 其 他 线程 往 队 列 中 放 
元 素 ， 如 果 没 有 ， 也 会 等 待 。SynchronousQueue 适 用 于 两 个 线程 之 间 直 
接 传 递 信 息 、 事 件 或 任务 。 


LinkedTransferQueue 实 现 了 TransferQueue 接 口 ，TransferQueue 是 
BlockingQueue 的 子 接口 ， 但 增加 了 一 些 额 外 功能 ， 生 产 者 在 往 队 列 中 
放 元 素 时 ， 可 以 等 待 消费 者 接收 后 再 返回 ， 适 用 于 一 些 消 息 传 递 类 型 的 
应 用 中 。TransferQueue 的 接口 定义 为 : 











public interface TransferQueue<E> extends BlockingQueue<E> { 
// 如 果 有 消费 者 在 等 待 (执行 take 或 限时 的 po11)， 直 接 转 给 消费 者 ， 
// 返 回 true， 和 否则 返回 false， 不 入 队 
boolean tryTransfer(E e); 
// 如 果 有 消费 者 在 等 待 ， 直 接 转 给 消费 者 ， 否 则 入 队 ， 阻 塞 等 待 直到 被 消费 者 接收 后 再 i 
void transfer(E e) throws InterruptedException; 
// 如 果 有 消费 者 在 等 待 ， 直接 转 给 消费 者 ， 返 回 true 
// 和 否则 入 队 ， 阻 塞 等 待 限定 的 时 间 ， 如 果 最 后 被 消费 者 接收 ， 返 回 true 
boolean tryTransfer(E e, long timeout, TimeUnit unit) 

throws InterruptedException; 

// 是 否 有 消费 者 在 等 待 
boolean haswaitingConsumer(); 
// 等 待 的 消费 者 个 数 


int getwaitingConsumerCount(); 
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LinkedTransferQueue 是 基于 链表 实现 的 、 无 界 的 TransferQueue， 具 
体 实现 比较 复杂 ， 我 们 束 不 探讨 了 。 


关于 Java 并 发 包 的 各 种 容器 ， 人 至 此 就 介绍 完了 ， 在 实际 开发 中 ， 应 
冯 尽 鲁 使 用 这 些 现成 的 容器 ， 而 非 “重新 发 明 轮 子 ” 


Java 并 发 包 中 还 提供 了 一 种 方便 的 任务 执行 服务 ， 使 用 它 ， 可 以 将 
人 离 ， 大 大 简化 并 发 任务 和 线程 的 管 
理 ， 让 我 们 下 一 章 来 探讨 。 


第 18 半 寞 步 任务 执行 服务 


在 之 前 的 介绍 中 ， 线 程 Thread 既 表示 要 执行 的 任务 ， 又 表示 执行 的 
机 制 。Java 并 发 包 提 供 了 一 套 框架 ， 大 大 简化 了 执行 异步 任务 所 需 的 开 
发 。 这 套 框 架 引 入 了 一 个 “执行 服务 ”的 概念 ， 它 将 “任务 的 提交 ”和 “ 任 
务 的 执行 ? 相 分 离 , “执行 服务 ?封装 了 任务 执行 的 细节 ， 对 于 任务 提交 
者 而 言 ， 它 可 以 关注 于 任务 本 身 ， 如 提交 任务 、 获 取 结 果 、 取 消 任务 ， 
而 不 需要 关注 任务 执行 的 细节 ， 如 线程 创建 、 任 务 调度 、 线 程 关闭 等 。 


本 章 我 们 就 来 探讨 这 套 框 娘 ， 有 具体 分 为 3 个 小 节 : 18.1 节 介绍 基本 


概念 和 原理 ;18.2 市 介绍 任务 执行 服务 的 主要 实现 机 制 : 线程 池 ; 18.3 
节 介 绍 定时 任务 的 执行 服务 。 


18.1 基本 概念 和 原理 
下 面 ， 我 们 来 看 异步 任务 执行 服务 的 基本 接口 、 用 法 和 实现 原理 。 
18.1.1 基本 接口 


首先 ， 我 们 来 看 任务 执行 服务 涉及 的 基本 接口 : 


.Runnable 和 Callable: 表示 要 执行 的 异步 任务 。 





.Executor 和 ExecutorService: 表示 执行 服务 。 

:Future: 表示 异步 任务 的 结 

关于 Runnable 和 Callable， 我 们 在 前 面 章节 都 已 经 了 解 了 ， 都 表示 任 
务 ，Runnable 没 有 返回 结果 ， 而 Callable 有 ，Runnable 不 会 抛 出 异常 ， 而 


Callable 会 。 


Executor 表 示 最 简单 的 执行 服务 ， 其 定义 为 : 





public interface Executor { 
void execute(Runnable command); 
} 








就 是 可 以 执行 一 个 Runnable， 没 有 返回 结 采 。 接 口 没 有 限定 任务 如 
何 执行 ， 可 能 是 创建 一 个 新 线程 ， 可 能 是 复 用 线程 池 中 的 茶 个 线程 ， 也 
可 能 是 在 调用 者 线程 中 执行 。 


ExecutorService 扩 展 了 Executor， 定 义 了 更 多 服务 ， 基 本 方法 有 : 











public interface ExecutorService extends Executor { 
<T> Future<T> submit(Callable<T> task); 
<T> Future<T> submit(Runnable task, T result); 
Future<?> submit(Runnable task); 
//..， 其 他 方法 

















} 





这 三 个 submit 都 表示 提交 一 个 任务 ， 返 回 值 类 型 都 是 Future， 返 回 
后 ， 只 是 表示 任务 已 提交 ， 不 代表 已 执行 ， 通 过 Future 可 以 查询 异步 任 
务 的 状态 、 获 取 最 终结 果 、 取 消 任务 等 。 我 们 知道 ， 对 于 Callable， 任 
务 最 终 有 个 返回 值 ， 而 对 于 Runnable 是 没有 返回 值 的， 第 二 个 提交 
Runnable 的 方法 可 以 同时 提供 一 个 结果 ， 在 异步 任务 结束 时 返回 : 第 三 
个 方法 异步 任务 的 最 终 返 回 值 为 null。 


我 们 来 看 Future 接 口 的 定义 : 











public interface Future<V> { 
boolean cancel(boolean mayInterruptIfRunning ) 
boolean isCancelled(); 
boolean isDone(); 
V get() throws InterruptedException, ExecutionException; 
V get(long timeout, TimeUnit unit) throws InterruptedException, 
ExecutionException, TimeoutException; 





get 用 于 返回 异步 任务 最 终 的 结果 ， 如 果 任 务 还 未 执行 完成 ， 会 阻 
塞 等 待 ， 另 一 个 get 方 法 可 以 限定 阻塞 等 待 的 时 间 ， 如 果 超 时 任务 还 未 
结束 ， 会 抛 出 TimeoutException 。 


cancel 用 于 取消 异步 任务 ， 如 果 任 务 已 完成 、 或 已 经 取消 、 或 由 于 
某 种 原因 不 能 取消 ，cancel 返 回 false， 和 否则 返回 true。 如 果 任 务 还 未 开 
台 ， 则 不 再 运行 。 但 如 果 任 务 已 经 在 运行 ， 则 不 一 定 能 取消 ， 参 数 
mayIterruptIfRunning 表 示 ， 如 果 任 务 正 在 执行 ， 是 否 调用 interrupt 方 法 
中 断 线 程 ， 如 果 为 false 就 不 会 ， 如 果 为 true， 就 会 答 试 中 断 线程 ， 但 我 
们 从 15.4 节 知道 ， 中 断 不 一 定 能 取消 线程 。 


isDone 和 isCancelled 用 于 查询 任务 状态 。isCancelled 表 示 任 务 是 否 被 
取消 ， 只 要 cancel 方 法 返回 了 true， 随 后 的 isCancelled 方 法 都 会 返回 
true， 即 使 执行 任务 的 线程 还 未 真正 结束 。isDone 表 示 任 务 是 否 结 束 ， 
不 管 什 么 原因 都 算 ， 可 能 是 任务 正常 结束 ， 可 能 是 任务 抛 出 了 异常 ， 也 
可 能 是 任务 被 取消 。 


我 们 再 来 看 下 get 方 法 ， 任 务 最 终 大 构 有 三 种 结果 : 


1) 正常 完成 ，get 方 法 会 返回 其 执行 结果 ， 如 果 任 务 是 Runnable 量 
没有 提供 结果 ， 返 回 null。 











2) 任务 执行 抛 出 了 异常 ，get 方 法 会 将 异常 包装 为 
ExecutionException 重 新 抛 出 ， 通 过 异常 的 getCause 方 法 可 以 获取 原 异 
常 。 





3) 任务 被 取消 了 ，get 方 法 会 抛 出 异常 CancellationException 。 
如 有 果 调 用 get 方 法 的 线程 被 中 断 了 ，get 方 法 会 抛 出 


InterruptedException。 


Future 是 一 个 重要 的 概念 ， 是 实现 “任务 的 提交 ”与 “任务 的 执行 *" 相 
分 离 的 关键 ， 是 其 中 的 “纽带 ”>， 任 务 提 交 者 和 任务 执行 服务 通过 它 隔 离 
各 目的 关注 点 ， 同 时 进行 协作 。 


18.1.2 基本 用 法 





说 了 这 么 多 接口 ， 具 体 怎 么 用 呢 ? 我 们 看 个 简单 的 例子 ， 如 代码 清 
单 18-1 所 示 。 


代码 清单 18-1 任务 执行 服务 的 基本 示例 





public class BasicDemo { 
static class Task implements Callable<Integer> { 
@Override 
public Integer call() throws Exception { 
int sleepSeconds = new Random().nextInt(1000); 
Thread.sleep(sleepSeconds); 
return SleepSeconds ; 


public static void main(String[] args) throws InterruptedException { 
ExecutorService executor = Executors.newSingleThreadExecutor(); 
Future<Integer> future = executor.submit(new Task()); 











// 模 拟 执 行 其 他 任务 

Thread. sleep(100); 

try { 
System.out.printlin(future.get()); 

} catch (ExecutionException e) { 
e.printSstackTrace( ); 





executor .shutdown(); 





我 们 使 用 工厂 类 Executors 创 建 了 一 个 任务 执行 服务 。Executors 有 多 


个 静态 方法 ， 可 以 用 来 创建 ExecutorService， 这 里 使 用 的 是 : 





public static ExecutorService newSingleThreadExecutor() 





表示 使 用 一 个 线程 执行 所 有 服务 ， 后 续 我 们 会 详细 介绍 Executors， 
注意 与 Executor 相 区 别 ， 后 者 是 单数 ， 是 接口 。 


不 管 ExecutorService 是 如 何 创建 的 ， 对 使 用 者 而 言 ， 用 法 都 一 样 ， 
例子 提交 了 一 个 任务 ， 提 交 后 ， 可 以 继续 执行 其 他 事情 ， 随 后 可 以 通过 
Future 获 取 最 终结 果 或 处 理 任务 执行 的 异常 。 


最 后 ， 我 们 调用 了 ExecutorService 的 shutdown 方 法 ， 它 会 关闭 任务 
执行 服务 。 


前 面 我 们 只 是 介绍 了 ExecutorService 的 三 个 submit 方 法 ， 其 实 它 还 
有 如 下 方法 : 





public interface ExecutorService extends Executor { 
void shutdown(); 
List<Runnable> shutdownNow(); 
boolean isShutdown(); 
boolean isTerminated(); 
boolean awaitTermination(long timeout, TimeUnit unit) 
throws InterruptedException,; 
<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks) 
throws InterruptedException; 
<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks, 
long timeout, TimeUnit unit) 
throws InterruptedException; 
<T> T invokeAny(Collection<? extends Callable<T>> tasks) 
throws InterruptedException, ExecutionException,; 
<T> T invokeAny(Collection<? extends Callable<T>> tasks, 
long timeout, TimeUnit unit) 
throws InterruptedException, ExecutionException, TimeoutException,; 





有 两 个 关闭 方法 : shutdown 和 shutdownNow。 区 别 是 ，shutdown 表 
示 不 再 接受 新 任务 ， 但 已 提交 的 任务 会 继续 执行 ， 即 使 任务 还 未 开始 执 
行 ;， shutdownNow 不 仅 不 接受 新 任务 ， 而 且 会 终止 已 提交 但 尚未 执行 的 
任务 ， 对 于 正在 执行 的 任务 ， 一 般 会 调用 线程 的 interrupt 方 法 尝试 中 
断 ， 不 过 ， 线 程 可 能 不 啊 应 中 断 ，shutdownNow 会 返回 已 提交 但 尚未 执 
行 的 任务 列表 。 


shutdown 和 shutdownNow 不 会 阻塞 等 待 ， 它 们 返回 后 不 代表 所 有 任 
务 都 已 结束 ， 不 过 isShutdown 方 法 会 返回 true。 调 用 者 可 以 通过 
awaitTermination 等 待 所 有 任务 结束 ， 它 可 以 限定 等 待 的 时 间 ， 如 果 超 时 
前 所 有 任务 都 结束 了 ， 即 isTerminated 方 法 返回 true， 则 返回 true， 人 否则 
返回 false。 


ExecutorService 有 两 组 批量 提交 任务 的 方法 : invokeAll 和 
invokeAny， 它 们 都 有 两 个 版 本 ， 其 中 一 个 限定 等 待 时 间 。 


invokeAll 等 待 所 有 任务 完成 ， 返 回 的 Future 列 表 中 ， 每 个 Future 的 
isDone 方 法 都 返回 true， 不 过 isDone 为 true 不 代表 任务 就 执行 成 功 了 ， 可 
能 是 被 取消 了 。invokeAl 可 以 指定 等 待 时 间 ， 如 果 超 时 后 有 的 任务 没完 
成 ， 就 会 被 取消 。 


而 对 于 invokeAny， 只 要 有 一 个 任务 在 限时 内 成 功 返 回 了 ， 它 就 会 
返回 该 任务 的 结果 ， 其 他 任务 会 被 取消 ; 如 有 果 没 有 任务 能 在 限时 内 成 功 
返回 ， 抛 出 TimeoutException; 如 果 限 时 内 所 有 任务 都 结束 了 ， 但 都 发 
生 了 异常 ， 抛 出 ExecutionException 。 


使 用 ExecutorService， 编 写 并 发 异步 任务 的 代码 就 像 写 顺序 程序 一 


样 ， 不 用 关心 线程 的 创建 和 协调 ， 只 需要 提交 任务 、 处 理 结果 就 可 以 
了 ， 大 大 简化 了 开发 工作 。 








18.1.3 ”基本 实现 原理 


了 解 了 ExecutorService 和 Future 的 基本 用 法 ， 我 们 来 看 下 它们 的 基 
本 实现 原理 。 





ExecutorService 的 主要 实现 类 是 ThreadPoolExecutor， 它 是 基于 线程 
池 实 现 的 ， 关 于 线程 池 我 们 下 节 再 介绍 。ExecutorService 有 一 个 抽象 实 
现 类 AbstractExecutorService， 本 节 ， 我 们 简要 分 析 其 原理 ， 并 基于 它 实 
现 一 个 简单 的 ExecutorService。Future 的 主要 实现 类 是 FutureTask， 我 们 
也 会 简要 探讨 其 原理 。 


1.AbstractExecutorService 


AbstractExecutorService 提 供 了 submit、invokeAll 和 invokeAny 的 默认 





实现 ， 子 类 需要 实现 其 他 方法 。 除 了 execute， 其 他 方法 都 与 执行 服务 的 
生命 周期 管理 有 关 ， 简 化 起 见 ， 我 们 忽略 其 实现 ， 主 要 考虑 execute。 
submit/invokeAll/invokeAny 最 终 都 会 调用 execute，execute 决 定 了 到 底 如 
何 执行 任务 ， 简 化 起 见 ， 我 们 为 每 个 任务 创建 一 个 线程 。 一 个 完整 的 最 
简单 的 ExecutorService 实 现 类 如 代码 清单 18-2 所 示 。 


代码 清单 18-2 一 个 简单 的 ExecutorService 实 现 类 





public class SimpleExecutorService extends AbstractExecutorService { 
Q@Override 
public void shutdown() { 
} 


Q@Override 
public List<Runnable> shutdownNow() { 
return null; 


Q@override 
public boolean isShutdown() { 
return false; 


Q@Override 
public boolean isTerminated() { 
return false; 


Q@Override 
public boolean awaitTermination(long timeout, TimeUnit unit) 
throws InterruptedException { 
return false; 


Q@Override 

public void execute(Runnable command) { 
new Thread(command).start(); 

} 





对 于 前 面 的 例子 ， 创 建 ExecutorService 的 代码 可 以 替换 为 : 





ExecutorService executor = new SimpleExecutorService( ); 





可 以 实现 相同 的 效果 。 


ExecutorService 最 基本 的 方法 是 submit， 它 是 如 何 实现 的 呢 ? 我 们 
来 看 AbstractExecutor-Service 的 代码 (基于 Java 7) : 








public <T> Future<T> submit(Callable<T> task) { 
if(task == null) throw new NullpointerException(); 


RunnableFuture<T> ftask = newTaskFor(task ) ; 
execute(ftask); 
return ftask; 





它 调 用 newTaskFor 生 成 了 一 个 RunnableFuture，RunnableFuture 是 一 
个 接口 ， 既 扩 展 了 Runnable， 叉 扩展 了 Future， 没 有 定义 新 方法 ， 作 为 
Runnable， 它 表示 要 执行 的 任务 ， 0 execute 方 法 进行 执行 ， 作 为 
J 它 又 表示 任务 执行 的 异步 结 这 可 能 令 人 混 消 ， 我 们 来 看 具 








protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) { 
return new FutureTask<T>(callable); 
} 





束 是 创建 了 一 个 FutureTask 对 象 ，FutureTask 实 现 了 RunnableFuture 
接口 。 它 是 怎么 实现 的 呢 ? 我 们 接 下 来 看 〈 基 于 Java7) 。 


2.FutureTask 


它 有 一 个 成 员 变 量 表示 待 执行 的 任务 ， 声 明 为 : 











private Callable<V> callable; 





有 个 整数 变量 state 表 示 状 态 ， 声 明 为 : 





private volatile int state; 


















































Ls 上 

取 值 可 能 为 : 
NEW = 0; // 刚 开始 的 状态 ， 或 任务 在 运行 
COMPLETING ”= 1; // 临 时 状态 ， 任 务 即 将 结束 ， 在 设置 结果 
NORMAL = 2; // 任 务 正常 执行 完 
EXCEPTIONAL = 3; // 任 务 执行 抛 出 异常 结束 
CANCELLED = 4; // 任 务 被 取消 
INTERRUPTING = 5; // 任 务 在 被 中 断 
INTERRUPTED ”= 6; // 任 务 被 中 断 

















private Object outcome 








有 个 变量 表示 运行 任务 的 线程 : 





private volatile Thread runner; 





还 有 个 单 问 链 表 表 示 等 待 任务 执行 结果 的 线程 : 





private volatile WaitNode waiters 





FutureTask 的 构造 方法 会 初始 化 callable 和 状态 ， 如 果 FutureTask 接 
受 的 是 一 个 Runnable 对 象 ， 它 会 调用 Executors.callable 转 换 为 Callable 对 
象 ， 如 下 所 示 : 





public FutureTask(Runnable runnable, V result) { 
this.callable = Executors.callable(runnable, result); 
this.state = NEW， //ensure visibility of callable 





任务 执行 服务 会 使 用 一 个 线程 执行 FutureTask 的 run 方 法 。run 方 法 
的 代码 为 : 





public void run() { 
if(state != NEW || 
IUNSAFE .compareAndSwapObject(this, runneroffset, 
null, Thread.currentThread())) 
return; 
try { 
Callable<V> c = callable; 
if(c != Null && state == NEW) { 
V result,; 
boolean ran; 
try { 
result = c.call(); 
ran = true; 
} catch (Throwable ex) { 
result = null,; 
ran = false,; 
setException(ex); 


if(ran) 
set(result); 


} 
} finally { 
//runner must be non-null until state is settled to 
//prevent concurrent calls to run() 
runner = null; 
//state must be re-read after nulling runner to prevent 
//leaked interrupts 
int s = state,; 
if(s >= INTERRUPTING) 
handlePossibleCancellationInterrupt(s); 





其 基本 逻辑 是 : 
1) 调用 callable 的 call] 方 法 ， 捕 获 任何 异常 ; 
2) 如 果 正 党 执行 完成 ， 调 用 set 设 置 结 果 ， 保 存 到 outcome; 


3) 如 果 执行 过 程 发 生 异 常 ， 调 用 setException 设 置 异 常 ， 异 常 也 
保存 到 outcome， 但 状态 不 一 样 ; 


4) set 和 setException 除 了 设置 结果 、 修 改 状 态 外 ， 还 会 调用 
finishCompletion， 它 会 唤醒 所 有 等 待 结果 的 线程 。 


对 于 任务 提交 者 ， 它 通过 get 方 法 获取 结果 ， 限 时 get 方 法 的 代码 








讨 








public V get(long timeout, TimeUnit unit) 

throws InterruptedException, ExecutionException, TimeoutException { 

if(unit == null) 
throw new NullPointerException(); 

int s = State' 

if(s <= COMPLETING && 
(Ss = awaitDone(true, unit.toNanos(timeout))) <= COMPLETING ) 
throw new TimeoutException(); 

return report(s); 





其 基本 逻辑 是 : 如 果 任 务 还 未 执行 完毕 ， 就 等 待 ， 最 后 调用 report 
报告 结果 ，report 根 据 状 态 返 回 结果 或 抛 出 异常 ， 代 码 为 : 





private V report(int s) throws ExecutionException { 
Object x = outcome,; 
if(s == NORMAL) 
return (V)x; 


if(s >= CANCELLED) 
throw new CancellationException(); 
throw new ExecutionException( (Throwable)x); 





cancel 方 法 的 代码 为 : 





public boolean cancel(boolean mayInterruptIfRunning) { 
if(state != NEW) 
return false; 
if(mayInterruptIfRunning) { 
if(!UNSAFE.compareAndSwapInt(this, stateOoffset, NEW, INTERRUPTING)) 
return false,; 
Thread t = runner; 
if(t != null) 
t.interrupt(); 
UNSAFE .putOrderedInt(this, stateOffset, INTERRUPTED); // final state 


else if(!UNSAFE.compareAndSwapInt(this, stateOoffset, NEW, CANCELLED)) 
return false; 

finishCompletion(); 

return true; 





其 基本 逻辑 为 : 
.如 果 任 务 已 结束 或 取消 ， 返 回 false; 


如果 mayInterruptIfRunning 为 true， 调 用 interrupt 中 断 线 程 ， 设 置 状 
态 为 INTERR-UPTED; 


-如果 maylInterruptIfRunning 为 false， 设 置 状 态 为 CANCELLED; 


.调用 finishCompletion 唤 醒 所 有 等 待 结果 的 线程 。 
18.1.4 小结 


本 节 介 绍 了 Java 并 发 包 中 任务 执行 服务 的 基本 概念 和 原理 ， 访 服务 
体现 了 并 发 异步 开发 中 “关注 点 分 离 ” 的 思想 ， 使 用 者 只 需要 通过 
ExecutorService 提 交 任 务 ， 通 过 Future 操 作 任 务 和 结果 即 可 ， 不 需要 关 
注 线程 创建 和 协调 的 细节 。 


本 节 主 要 介绍 了 AbstractExecutorService 和 FutureTask 的 基本 原理 ， 


实现 了 一 个 最 简单 的 执行 服务 SimpleExecutorService， 对 每 个 任务 创建 
一 个 单独 的 线程 。 实 际 中 ， 最 经 常 使 用 的 执行 服务 是 基于 线程 池 实 现 的 
ThreadPoolExecutor， 让 我 们 下 一 节 来 探讨 。 





18.2 ”线程 池 


线程 池 是 并 发 程序 中 一 个 非常 重要 的 概念 和 技术 。 线程 池 ， 顾 名 
思 义 ， 如 是 一 个 线程 的 池子 ， 里 面 有 大 干线 程 ， 它 们 的 目的 就 是 执行 提 
交 给 线程 地 的 任务 ， 执 行 完 一 个 任务 后 不 会 退出 ， 而 是 继续 等 竺 或 执行 
新 任务 。 线 程 池 主 要 由 两 个 概念 组 成 : 一 个 是 任务 队列 ; 另 一 个 是 工 
作者 线程 。 工 作者 线程 主体 就 是 一 个 循环 ， 循 环 从 队列 中 接受 任务 并 
执行 ， 任 务 队 列 保存 待 执行 的 任务 。 


线程 池 的 概念 类 似 于 生活 中 的 一 些 排 队 场景 ， 比 如 在 医院 排队 挂 
写 、 在 银行 排队 办 理 业务 等 ， 一 般 都 由 右 干 窗口 提供 服务 ， 这 些 服 务 窗 
口 类 似 于 工作 者 线程 ， 队 列 的 概念 是 类 似 的 ， 只 是 在 现实 场景 中 ， 每 个 
窗口 经 党 有 一 个 单独 的 队列 ， 这 种 排队 难以 公平 ， 随 着 信息 化 的 发 展 ， 
越 来 越 多 的 排队 场合 使 用 虚拟 的 统一 队列 ， 一 般 都 是 先 拿 一 个 排队 号 ， 
然后 按 号 依次 服务 。 


线程 池 的 优点 是 显而易见 的 : 

: 它 可 以 重用 线程 ， 避 人 免 线 程 创建 的 开销 。 

.任务 过 多 时 ， 通 过 排队 避免 创建 过 多 线程 ， 减 少 系统 资源 消耗 和 
竞争 ， 确 保 任 务 有 序 完 成 。 

Java 并 发 包 中 线程 池 的 实现 类 是 ThreadPoolExecutor， 它 继承 自 
AbstractExecutor-Service， 实 现 了 ExecutorService， 基 本 用 法 与 上 节 介 绍 
的 类 似 ， 我 们 就 不 歼 述 了 。 不 过 ，ThreadPoolExecutor 有 一 些 重要 的 参 


0 
些 参 数 。 














18.2.1 理解 线程 池 


先 来 看 ThreadPoolExecutor 的 构造 方法 。ThreadPoolExecutor 有 多 个 
构造 方法 ， 都 需要 一 些 参数 ， 主 要 构造 方法 有 : 








public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, 


long keepAliveTime, TimeUnit unit, BlockingQueue<RuNnable> workQueue) 
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, 

long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, 

ThreadFactory threadFactory, RejectedExecutionHandler handler) 





第 二 个 构造 方法 多 了 两 个 参数 threadFactory 和 handler， 这 两 个 参数 
一 般 不 需要 ， 第 一 个 构造 方法 会 设置 默认 值 。 参 数 corePoolSize、 
maximumPoolSize、keepAliveTime、unit 用 于 控制 线程 池 中 线程 的 个 
数 ，workQueue 表 示 任 务 队 列 ，threadFactory 用 于 对 创建 的 线程 进行 一 
些 配置 ，handler 表 示 任 务 拒 绝 策略 。 下 面 我 们 详细 探讨 下 这 些 参 数 。 


1. 线 程 池 大 小 
线程 池 的 大 小 主要 与 4 个 参数 有 关 : 
corePoolSize: 核心 线程 个 数 。 
maximumPoolSize: 最 大 线程 个 数 。 
:keepAliveTime 和 unit 空闲 线程 存活 时 间 。 


maximumPoolSize 表 示 线 程 池 中 的 最 多 线程 数 ， 线 程 的 个 数 会 动态 
变化 ， 但 这 是 最 大 值 ， 不 管 有 多 少 任务 ， 都 不 会 创建 比 这 个 值 大 的 线程 
个 数 。corePoolSize 表 示 线 程 池 中 的 核心 线程 个 数 ， 不 过 ， 并 不 是 一 开 
台 束 创建 这 么 多 线程 ， 刚 创建 一 个 线程 池 后 ， 实 际 上 并 不 会 创建 任何 线 


程 。 


一 般 情况 下 ， 有 新 任务 到 来 的 时 候 ， 如 果 当 前 线程 个 数 小 于 
corePoolSiz， 束 会 创建 一 个 新 线程 来 执行 该 任务 ， 需 要 说 明 的 是 ， 即 使 
其 他 线程 现在 也 是 空闲 的 ， 也 会 创建 新 线程 。 不 过 ， 如 果 线 程 个 数 大 于 
等 于 corePoolSiz， 那 就 不 会 立即 创建 新 线程 了 ， 它 会 先 尝试 排队 ， 需 要 
强调 的 是 ， 它 是 “尝试 ”排队 ， 而 不 是 “ 阻 窄 等 待 ? 入 队 ， 如 果 队 列 满 了 或 
其 他 原因 不 能 立即 入 队 ， 它 整 不 会 排队 ， 而 是 检查 线程 个 数 是 否 达 到 了 
maximumPoolSize， 如 果 没 有 ， 融 会 继续 创建 线程 ， 直 到 线程 数 达 到 


maximumPoolSize。 
keepAliveTime 的 目的 是 为 了 释放 多 余 的 线程 资源 ， 它 表示 ， 当 线 


程 池 中 的 线程 个 数 大 于 corePoolSize 时 额外 空间 线程 的 存活 时 间 。 也 就 
征 资 ， 一 个 非 核心 线程 ， 在 空闲 等 竺 新 任务 时 ， 会 有 一 个 最 长 等 待 时 

















间 ， 即 keepAliveTimne， 如 果 到 了 时 间 还 是 没有 新 任务 ， 束 会 被 终止 。 
如 果 该 值 为 0， 则 表示 所 有 线程 都 不 会 超时 终止 。 


这 几 个 参数 除了 可 以 在 构造 方法 中 进行 指定 外 ， 还 可 以 通过 
getter/setter 方 法 进行 查看 和 修改 。 





除了 这 些 静 态 参数 ，ThreadPoolExecutor 还 可 以 查看 关于 线程 和 任 
务 数 的 一 些 动态 数字 : 





// 返 回 当前 线程 个 数 

public int getPoolSize() 

// 返 回 线程 池 曾 经 达到 过 的 最 大 线程 个 数 

public int getLargestPoolSize() 

// 返 回 线程 池 自 创建 以 来 所 有 已 完成 的 任务 数 

public long getCompletedTaskCount() 

// 返 回 所 有 任务 数 ， 包 括 所 有 已 完成 的 加 上 所 有 排队 待 执行 的 
public long getTaskCount() 



















































































2. 队 列 

ThreadPoolExecutor 要 求 的 队列 类 型 是 阻塞 队列 BlockingQueue， 我 
们 在 17.4 节 介绍 过 多 种 BlockingQueue， 它 们 都 可 以 用 作 线 程 池 的 队列 ， 
比如 : 


:LinkedBlockingQueue: 基于 链表 的 阻塞 队列 ， 可 以 指定 最 大 长 
度 ， 但 默认 是 无 界 的 。 


'ArrayBlockingQueue: 基于 数组 的 有 界 阻 塞 队列 。 
:PriorityBlockingQueue: 基于 堆 的 无 界 阻 塞 优先 级 队列 。 
SynchronousQueue: 没有 实际 存储 空间 的 同步 阻塞 队列 。 

如 果 用 的 是 无 界 队列 ， 需 要 强调 的 是 ， 线 程 个 数 最 多 只 能 达到 


corePoolSize， 到 达 core-PoolSize 后 ， 新 的 任务 总 会 排队 ， 参 数 
maximumPoolSize 也 就 没有 意义 了 。 








对 于 SynchronousQueue， 我 们 知道 ， 它 没有 实际 存储 元 素 的 空间 ， 
当 党 试 排队 时 ， 只 有 正好 有 空闲 线程 在 等 待 接受 任务 时 ， 才 会 入 队 成 
功 ， 和 否则 ， 总 是 会 创建 新 线程 ， 直 到 达到 maximumPoolSize。 





3. 任 务 拒绝 策略 


如 果 队 列 有 界 ， 且 maximumPoolSize 有 限 ， 则 当 队 列 排 满 ， 线 程 个 
数 也 达到 了 maxi-mumPoolSize， 这 时 ， 新 任务 来 了 ， 如 何 处 理 呢 ?此 
时 ， 会 触发 线程 池 的 任务 拒绝 策略 。 


默认 情况 下 ， 提 交 任 务 的 方法 (如 execute/submit/invokeAll 等 ) 会 
抛 出 异常 ， 类 型 为 RejectedExecutionException 。 


不 过 ， 拒 绝 策 略 是 可 以 上 自 定义 的 ，ThreadPoolExecutor 实 现 了 4 种 处 
I 


1) ThreadPoolExecutor.AbortPolicy: 这 就 是 默认 的 方式 ， 抛 出 异 
A 
吊 。 








2) ThreadPoolExecutor.DiscardPolicy: 静默 处 理 ， 忽 略 新 任务 ， 不 
抛 出 异常 ， 也 不 执行 。 


3) ThreadPoolExecutor.DiscardOldestPolicy: 将 等 竺 时 间 最 长 的 任 
务 扔 挥 ， 然 后 自己 排队 。 


4) ThreadPoolExecutor.CallerRunsPolicy: 在 任务 提交 者 线程 中 执行 
任务 ， 而 不 是 交 给 线程 池 中 的 线程 执行 。 


它们 都 是 ThreadPoolExecutor 的 public 静 态 内 部 类 ， 都 实现 了 
RejectedExecutionHandler 接 口 ， 这 个 接口 的 定义 为 : 





public interface RejectedExecutionHandler { 
void rejectedExecution(Runnable r, ThreadPoolExecutor executor); 
} 





当 线 程 池 不 能 接受 任务 时 ， 调 用 其 拒绝 集 略 的 rejectedExecution 方 
Ss 


拒绝 策略 可 以 在 构造 方法 中 进行 指定 ， 也 可 以 通过 如 下 方法 进行 指 








mm 


丰 





public void setRejectedExecutionHandler(RejectedExecutionHandler handler) 


”默认 的 RejectedExecutionHandler 是 一 个 AbortPolicy 实 例 ， 如 下 所 
修 \: 





private static final RejectedExecutionHandler defaultHandler = 
new AbortPolicy(); 





而 AbortPolicy 的 rejectedExecution 实 现 就 是 抛 出 异常 ， 如 下 所 示 : 





public void rejectedExecution(Runnable r, ThreadPoolExecutor e) { 
throw new RejectedExecutionException("Task " + r.toString() + 
" rejected from " + e.toString()); 


} 





我 们 需要 强调 下 ， 拒 绝 策 略 只 有 在 队列 有 界 ， 日 maximumPoolSize 
有 限 的 情况 下 才 会 触发 。 如 果 队 列 无 界 ， 服 务 不 了 的 任务 总 是 会 排队 ， 
但 这 不 一 定 是 期 望 的 结果 ， 因 为 请 求 处 理 队 列 可 能 会 消耗 非常 大 的 内 
存 ， 甚 至 引发 内 存 不 够 的 异常 。 如 果 队 列 有 界 但 maxi-mumPoolSize 无 
上限， 可 能 会 创建 过 多 的 线程 ， 占 满 CPU 和 内 存 ， 使 得 任何 任务 都 难以 完 
成 。 所 以 ， 在 任务 量 非常 大 的 场景 中 ， 让 拒绝 策略 有 机 会 执行 是 保证 系 
统 稳定 运行 很 重要 的 方面 。 


4 所 种 工厂 


线程 池 还 可 以 接受 一 个 参数 : ThreadFactory。 它 是 一 个 接口 ， 定 义 


NA 
. 














public interface ThreadFactory { 
Thread newThread(Runnable r); 





这 个 接口 根据 Runnable 创 建 一 个 Thread，ThreadPoolExecutor 的 默认 
实现 是 Executors 类 中 的 静态 内 部 类 DefaultThreadFactory， 主 要 就 是 创建 
一 个 线程 ， 给 线程 设置 一 个 名 称 ， 设 置 daemon 属 性 为 false， 设 置 线程 优 
先 级 为 标准 默认 优先 级 ， 线 程 名 称 的 格式 为 : pool-< 线 程 池 编 号 >- 
thread-< 线 程 编 号 >。 如 果 需 要 目 定 义 一 些 线程 的 属性 ， 比 如 名 称 ， 可 以 
实现 自 定 义 的 ThreadFactory。 


5. 关 于 核心 线程 的 特殊 配置 


线程 个 数 小 于 等 于 corePoolSize 时 ， 我 们 称 这 些 线程 为 核心 线程 ， 
默认 情况 下 。 


-核心 线程 不 会 预先 创建 ， 只 有 当 有 任务 时 才 会 创建 。 
核心 线程 不 会 因为 空闲 而 被 终止 ，keepAliveTime 参 数 不 适 用 于 


Es 


不 过 ，ThreadPoolExecutor 有 如 下 方法 ， 可 以 改变 这 个 默认 行为 。 














// 预 先 创建 所 有 的 核心 线程 

public int prestartAllCoreThreads() 

// 创 建 一 个 核心 线程 ， 如 果 所 有 核心 线程 都 已 创建 ， 则 返回 false 
public boolean prestartCoreThread ( ) 

// 如 果 参 数 为 true， 则 keepAliveTime 参 数 也 适用 于 核心 线程 
public void allowCoreThreadTimeOut(boolean value) 

































































18.2.2 ”工厂 类 Executors 


类 Executors 提 供 了 一 些 静 态 工 厂 方法 ， 可 以 方便 地 创建 一 些 预 配置 
的 线程 池 ， 主 要 方法 有 : 





public static ExecutorService newSingleThreadExecutor() 
public static ExecutorService newFixedThreadPool(int nThreads) 
public static ExecutorService newCachedThreadPool() 





newSingleThreadExecutor 基 本 相当 于 调用 : 





newSingleThreadExecutor() { 
return new ThreadPoolExecutor(1, 1, OL, TimeUnit.MILLISECONDS, 
new LinkedBlockingQueue<RuNnable>()); 





只 使 用 一 个 线程 ， 使 用 无 界 队 列 LinkedBlockingQueue， 线 程 创建 后 
不 会 超时 终止 ， 该 线程 顺序 执行 所 有 任务 。 该 线程 池 适 用 于 需要 确保 所 
有 任务 被 顺序 执行 的 场合 。 


newEFixedThreadPool 的 代码 为 : 





public static ExecutorService newFixedThreadPool(int nThreads) { 
return new ThreadPoolExecutor(nThreads, nThreads, OL, 
TimeUnit .MILLISECONDS, new LinkedBlockingQueue<RuNnable>()); 
} 





使 用 固定 数目 的 n 个 线程 ， 使 用 无 界 队 列 LinkedBlockingQueue， 线 
程 创建 后 不 会 超时 终止 。 和 newSingleThreadExecutor 一 样 ， 由 于 是 无 界 
队列 ， 如 果 排 队 任务 过 多 ， 可 能 会 消耗 过 多 的 内 存 。 


newCachedThreadPool 的 代码 为 : 





public static ExecutorService newCachedThreadPool() { 
return new ThreadPoolExecutor(0, Integer.MAX VALUE, 60L, 
TimeUnit.SECONDS, new SynchronousQueue<RuUNnable>()); 


} 





它 的 corePoolSize 为 0，maximumPoolSize 为 nteger.MAX_VALUE， 
keepAliveTime 是 60 秒 ， 队 列 为 SynchronousQueue。 它 的 含义 是 : 当 新 任 
务 到 来 时 ， 如 果 正 好 有 空闲 线程 在 等 竺 任务， 则 其 中 一 个 空闲 线程 接受 
该 任务 ， 人 否则 就 总 是 创建 一 个 新 线程 ， 创 建 的 总 线程 个 数 不 受 限制 ， 对 
任 一 空闲 线程 ， 如 果 60 秒 内 没有 新 任务 ， 就 终止 。 


实际 中 ， 应 该 使 用 newFixedThreadPool 还 是 newCachedThreadPool 
呢 ? 


在 系统 负载 很 高 的 情况 下 ，newFixedThreadPool 可 以 通过 队列 对 新 
任务 排队 ， 保 证 有 足够 的 资源 处 理 实 际 的 任务 ， 而 
newCachedThreadPool 会 为 每 个 任务 创建 一 个 线程 ， 导 致 创 建 过 多 的 线 
程 竞争 CPU 和 内 存 资 源 ， 使 得 任何 实际 任务 都 难以 完成 ， 这 时 ， 
newFixedThreadPool 更 为 适用 。 


不 过 ， 如 果 系 统 负载 不 太 高 ， 单 个 任务 的 执行 时 间 也 比较 短 ， 
newCachedThreadPool 的 效率 可 能 更 高 ， 因 为 任务 可 以 不 经 排队 ， 直 接 
交 给 某 一 个 空闲 线程 。 


在 系统 负载 可 能 极 高 的 情况 下 ， 两 者 都 不 是 好 的 选择 ， 
newFixedThreadPool 的 问题 是 队列 过 长 ， 而 newCachedThreadPool 的 问题 








是 线程 过 多 ， 这 时 ， 应 根据 具体 情况 目 定 义 ThreadPoolExecutor， 传 递 
合适 的 参数 。 


18.2.3 ”线程 池 的 死 锁 


关于 提交 给 线程 池 的 任务 ， 我 们 需要 注意 一 种 情况 ， 就 是 任务 之 间 
有 依赖 ， 这 种 情况 可 能 会 出 现 死 锁 。 比 如 任务 A， 在 它 的 执行 过 程 中 ， 
它 给 同样 的 任务 执行 服务 提交 了 一 个 任务 B， 但 需要 等 待 任务 B 结 


如 果 任 务 A 是 提交 给 了 一 个 单线 程 线程 池 ， 一 定 会 出 现 死 锁 ，A 在 
等 竺 B 的 结束 ， 而 B 在 队列 中 等 待 被 调度 。 如 果 是 提交 给 了 一 个 限定 线 
程 个 数 的 线程 池 ， 也 有 可 能 因 线 程 数 限制 出 现 死 锁 。 


怎么 解雇 这 种 问题 呢 ? 可 以 使 用 newCachedThreadPool 创 建 线 程 
池 ， 让 线程 数 不 受 限 制 。 另 一 个 解决 方法 是 使 用 SynchronousQueue， 它 
可 以 避免 死 锁 ， 怎 么 做 到 的 呢 ? 对 于 普通 队列 ， 入 队 只 是 把 任务 放 到 了 
队列 中 ， 而 对 于 SynchronousQueue 来 说 ， 入 队 成 功 就 意味 着 已 有 线程 接 
受 处 理 ， 如 果 入 队 失 败 ， 可 以 创建 更 多 线程 直到 maximumPoolSize， 如 
果 达 到 了 maximumPoolSize， 会 触发 拒绝 机 制 ， 不 管 怎 么 样 ， 都 不 会 死 
锁 。 











I 站 结 


本 节 介 绍 了 线程 池 的 基本 概念 ， 详 细 探讨 了 其 主要 参数 的 含义 ， 理 
解 这 些 参数 对 于 合理 使 用 线程 池 是 非常 重要 的 ， 对 于 相互 依赖 的 任务 ， 
需要 注意 避免 出 现 死 锁 。 


18.3 ”定时 任务 的 那些 陷阱 


本 节 探 讨 定时 任务 ， 定 时 任务 的 应 用 场景 是 非常 多 的 ， 比 如 : 
` 闸 钟 程序 或 任务 提醒 ， 指 定时 间 叫 床 或 在 指定 日 期 提醒 还 信用 





:监控 系统 ， 每 隔 一 段 时 间 采 集 下 系统 数据 ， 对 异 间 事件 报警 。 
统计 系统 ， 一 般 凌 晨 一 定时 间 统 计 昨 日 的 各 种 数据 指标 。 
在 Java 中 ， 主 要 有 两 种 方式 实现 定时 任务 : 


.使 用 java.util 包 中 的 Timer 和 TimerTask。 








.使 用 Java 并 发 包 中 的 ScheduledExecutorService。 
它们 的 基本 用 法 都 是 比较 简单 的 ， 但 如 果 对 它们 没有 足够 的 了 解 ， 


则 很 容易 陷入 其 中 的 一 些 陷 阱 。 下 面 ， 我 们 惑 来 介绍 它们 的 用 法 、 原 理 
以 及 那些 陷阱 。 


18.3.1 Timer 和 TimerTask 


我 们 先 介绍 它们 的 基本 用 法 和 示例 ， 然 后 介绍 它们 的 实现 原理 和 一 
些 注意 事项 。 


1. 基 本 用 法 
TimerTask 表 示 一 个 定时 任务 ， 它 是 一 个 抽象 类 ， 实 现 了 


Runnable， 有 具体 的 定时 任务 需要 继承 该 类 ， 实 现 run 方 法 。Timer 是 一 个 
具体 类 ， 它 负责 定时 任务 的 调度 和 执行 ， 主 要 方法 有 : 





// 在 指定 绝对 时 间 time 运 行 任务 task 

public void schedule(TimerTask task, Date time) 
// 在 当前 时 间 延 时 delay 毫 秒 后 运行 任务 task 

public void schedule(TimerTask task, long delay) 
// 固 定 延 时 重复 执行 ， 第 一 次 计划 执行 时 间 为 firstTime， 

















// 后 一 次 的 计划 执行 时 间 为 前 一 次 "实际 "执行 时 间 加 上 period 

public void schedule(TimerTask task, Date firstTime, long period) 

// 同 样 是 固定 延 时 重复 执行 ， 第 一 次 执行 时 间 为 当前 时 间 加 上 delay 

public void schedule( TimerTask task, long delay, long period) 

// 固 定 频 率 重 复 执行 ， 第 一 次 计划 执行 时 [ 间 为 firstTime， 

// 后 一 次 的 计划 执行 时 间 为 前 一 次 "计划 "执行 时 间 加 上 period 

public void scheduleAtFixedRate(TimerTask task, Date firstTime, long period) 
// 同 样 是 固定 频率 重复 执行 ， 第 一 次 计 划 执 行 时 间 为 当前 时 间 加 上 delay 

public void scheduleAtFixedRate(TimerTask task, long delay, long period ) 
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需要 注意 固定 延 时 (fixed-delay) 与 固定 频率 (fixed-rate〉 的 区 
别 ， 二 者 都 是 重复 执行 ， 但 后 一 次 任务 执行 相对 的 时 间 是 不 一 样 的 ， 对 
于 固定 延 时 ， 它 是 基于 上 次 任务 的 “实际 ?执行 时 间 来 算 的 ， 如 果 由 于 某 
ee 0 则 本 次 任务 也 会 延 时 ， 而 固定 频率 会 尽量 补 
云 行 次 


另外 ， 需 要 注意 的 是 ， 如 果 第 一 次 计划 执行 的 时 间 firstTime 是 一 个 
过 去 的 时 间 ， 则 任务 会 立即 运行 ， 对 于 固定 延 时 的 任务 ， 下 次 任务 会 基 
一 次 执行 时 间 计算 ， 而 对 于 固定 频率 的 任务 ， 则 会 从 firstTime 开 始 
算 ， 有 可 能 加 上 period 后 还 是 一 个 过 去 时 间 ， 从 而 连续 运行 很 多 次 ， 
到 时 间 超 过 当前 时 间 。 我 们 通过 一 些 简单 的 例子 具体 来 看 下 。 


2. 基 本 示例 
看 一 个 最 简单 的 例子 ， 如 代码 清单 18-3 所 示 。 
代码 清单 18-3 ”Timer 基 本 示例 











public class BasicTimer { 
static class DelayTask extends TimerTask { 
@Override 
public void run() { 
System,out.println("delayed task"); 


} 


public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new DelayTask(), 1000); 
Thread. sleep(2000); 
timer.cancel(); 





创建 一 个 Timer 对 象 ，1 秒 钟 后 运行 DelayTask， 最 后 调用 Timer 的 
cancel 方 法 取消 所 有 定时 任务 。 


看 一 个 固定 延 时 的 简单 例子 ， 如 代码 清单 18-4 所 示 。 
代码 清单 18-4 Timer 固 定 延 时 示例 





public class TimerFixedDelay { 
static class LongRunningTask extends TimerTask { 
@Override 
public void run() { 
try { 
Thread. sleep(5000); 
} catch (InterruptedException e) { 


System.out.printin("long running finished"); 


} 
static class FixedDelayTask extends TimerTask { 
@Override 


public void run() { 
System.out.println(System,.currentTimeMillis()); 
} 


public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer,.schedule(new LongRunningTask(), 10); 
timer.schedule(new FixedDelayTask(), 100, 1000); 





有 两 个 定时 任务 ， 第 一 个 运行 一 次 ， 但 耗 时 5 秒 ， 第 二 个 是 重复 执 
行 ，1 秒 一 次 ， 第 一 个 先 运 行 。 运 行 该 程序 ， 会 发 现 ， 第 二 个 任务 只 有 
在 第 一 个 任务 运行 结束 后 才 会 开始 运行 ， 运 行 后 1 秒 一 次 。 如 果 丛 换 上 
面 的 代码 为 固定 频率 ， 即 变 为 代码 清单 18-5 所 示 。 


代码 清单 18-5”Timer 国 定 频 率 示例 














public class TimerFixedRate { 
static class LongRunningTask extends TimerTask { 


// 省 略 , 与 代码 清单 18-4 一 样 
} 


static class FixedRateTask extends TimerTask { 
// 省 略 , 与 代码 清单 18-4 一 样 









































public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer,.schedule(new LongRunningTask(), 10); 
timer.scheduleAtFixedRate(new FixedRateTask(), 100, 1000); 


运行 该 程序 ， 第 二 个 任务 同样 只 有 在 第 一 个 任务 运行 结束 后 才 会 运 
行 ， 但 它 会 把 之 前 没有 运行 的 次 数 补 过 来 ， 一 下 子 运 行 5 次 ， 输 出 类 似 
下 面 这 样 : 








long running finished 
1489467662330 
1489467662330 
1489467662330 
1489467662330 
1489467662330 
1489467662419 


3. 基 本 原理 


Timer 内 部 主要 由 任务 队列 和 Timer 线 程 两 部 分 组 成 。 任 务 队 列 是 一 
个 基于 堆 实现 的 优先 级 队列 ， 按 照 下 次 执行 的 时 间 排 优先 级 。Timer 线 
程 负责 执行 所 有 的 定时 任务 ， 需 要 强调 的 是 ， 一 个 Timer 对 象 只 有 一 个 
Timer 线 程 ， 所 以 ， 对 于 上 面 的 例子 ， 任 务 会 被 延迟 。 


Timer 线 程 主体 是 一 个 循环 ， 从 队列 中 获取 任务 ， 如 果 队 列 中 有 任 
务 且 计划 执行 时 间 小 于 等 于 当前 时 间 ， 束 执行 它 ， 如 果 队 列 中 没有 任务 
或 第 一 个 任务 延 时 还 没 到 ， 就 睡 眼 。 如 果 睡 眠 过 程 中 队列 上 添加 了 新 任 
务 且 新 任务 是 第 一 个 任务 ，Timer 线 程 会 被 唤醒 ， 重 新 进行 检查 。 


在 执行 任务 之 前 ，Timer 线 程 判 断 任 务 是 否 为 周期 任务 ， 如 果 是 ， 
就 设置 下 次 执行 的 时 间 并 添加 到 优先 级 队列 中 ， 对 于 固定 延 时 的 任务 ， 
下 次 执行 时 间 为 当前 时 间 加 上 period， 对 于 固定 频率 的 任务 ， 下 次 执行 
时 间 为 上 次 计划 执行 时 间 加 上 period。 


需要 强调 是 ， 下 次 任务 的 计划 是 在 执行 当前 任务 之 前 就 做 出 了 的 ， 
对 于 固定 延 时 的 任务 ， 延 时 相对 的 是 任务 执行 前 的 当前 时 间 ， 而 不 是 
任务 执行 后 ， 这 与 后 面 讲 到 的 Sched-uledExecutorService 的 固定 延 时 计算 
方法 是 不 同 的 ， 后 者 的 计算 方法 更 合乎 一 般 的 期 望 。 对 于 固定 频率 的 任 
务 ， 延 时 相对 的 是 最 先 的 计划 ， 所以， 很 有 可 能 会 出 现 前 面 例子 中 一 
下 子 执行 很 多 次 任务 的 情况 。 


4. 死 循环 
一 个 Timer 对 象 只 有 一 个 Timer 线 程 ， 这 意味 着 ， 定 时 任务 不 能 耗 时 














太 长 ， 更 不 能 是 无 限 循环 。 看 个 例子 ， 如 代码 清单 18-6 所 示 。 
代码 清单 18-6 ”Timer 死 循环 示例 





public class EndlessLoopTimer { 
static class LoopTask extends TimerTask { 
@Override 
public void run() { 
while (true) { 
try { 
// 模 拟 执行 任务 
Thread. sleep(1000); 
} catch (InterruptedException e) { 
e,printStackTrace( ); 
} 


} 


} 
// 永 远 也 没有 机 会 执行 
static class ExampleTask extends TimerTask { 
@Override 
public void run() { 
System.out.printin("hello"); 














public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new LoopTask(), 10); 
timer.schedule(new ExampleTask(), 100); 





第 一 个 定时 任务 是 一 个 无 限 循环 ， 其 后 的 定时 任务 ExampleTask 将 
永远 没有 机 会 执行 。 


5. 异 第 处 理 

关于 Timer 线 程 ， 还 需要 强调 非常 重要 的 一 点 : 在 执行 任何 一 个 任 
务 的 run 方 法 时 ， 一 旦 run 抛 出 异常 ，Timer 线 程 就 会 退出 ， 从 而 所 有 定时 
任务 都 会 被 取消 。 我 们 看 个 简单 的 示例 ， 如 代码 清单 18-7 所 示 。 


代码 清单 18-7 ”Timer 异 常 示例 





public class TimerException { 
static class TaskA extends TimerTask { 
@Override 
public void run() { 
System.out.printin("task A"); 


static class TaskB extends TimerTask { 
@Override 
public void run() { 
System.out.printin("task B"); 
throw new RuntimeException(); 


} 


public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new TaskA(), 1, 1000); 
timer.schedule(new TaskB(), 2000, 1000); 
} 
} 





”期 望 TaskA 每 秒 执行 一 次 ， 但 TaskB 会 抛 出 异常 ， 导 致 整个 定时 任 
务 锐 取消 ， 程 序 终止 ， 屏 天 输出 为 : 





task A 

task A 

task B 

Exception in thread "Timer-0" java.lang.RuntimeException 
at laoma.demo.timer.TimerException$TaskB.run(TimerException.java:21) 
at java.util.TimerThread.mainLoop(Timer .java:555) 
at java.util.TimerThread.run(Timer .java:505) 








所 以 ， 如 果 和 希望 各 个 定时 任务 不 互相 干扰 ， 一 定 要 在 run 方 法 内 捕 
获 所 有 有 异常。 


6. 小 结 


可 以 看 到 ，Timer/TimerTask 的 基本 使 用 是 比较 简单 的 ， 但 我 们 需要 


注意 : 
“后 全 只 有 一 个 线程 在 运行 ; 
固定 频率 的 任务 被 延迟 后 ， 可 能 会 立即 执行 多 次 ， 将 次 数 补 够 ; 
固定 延 时 任务 的 延 时 相对 的 是 任务 执行 前 的 时 间 ; 
不 要 在 定时 任务 中 使 用 无 限 循环 ; 
一 个 定时 任务 的 未 处 理 异常 会 导致 所 有 定时 任务 被 取消 。 


18.3.2 ScheduledEXxecutorService 


由 于 Timer/TimerTask 的 一 些 问题 ，Java 并 发 包 引 入 了 
ScheduledExecutorService， 下 面 我 们 介绍 它 的 基本 用 法 、 基 本 示例 和 基 
本 原理 。 

1. 基 本 用 法 


ScheduledExecutorService 是 一 个 接口 ， 其 定义 为 : 





public interface ScheduledExecutorService extends ExecutorService { 
// 单 次 执行 ， 在 指定 延 时 delay 后 运行 command 
public ScheduledFuture<?> schedule(Runnable command, long delay, 
TimeUnit unit); 
// 单 次 执行 ， 在 指定 延 时 delay 后 运行 callable 
public <V> ScheduledFuture<V> schedule(Callable<V> callable, long delay, 
TimeUnit unit); 
// 固 定 频 率 重 复 执行 
public ScheduledFuture<?> scheduleAtFixedRate(Runnable command, 
long initialDelay, long period, TimeUnit unit); 
// 固 定 延 时 重复 执行 
public ScheduledFuture<?> schedulewithFixedDelay(Runnable command, 
long initialDelay, long delay, TimeUnit unit); 























它们 的 返回 类 型 都 是 ScheduledFuture， 它 是 一 个 接口 ， 扩 展 了 
Future 和 Delayed， 没 有 定义 额外 方法 。 这 些 方法 的 大 部 分 语义 与 Timer 
中 的 基本 是 类 似 的 。 对 于 固定 频率 的 任务 ， 第 一 次 执行 时 间 为 
initialDelay 后 ， 第 二 次 为 initialDelay+period， 第 三 次 为 initial- 
Delay+2*period， 以 此 类 推 。 不 过 ， 对 于 固定 延 时 的 任务 ， 它 是 从 任务 
执行 后 开始 算 的 ， 第 一 次 为 initialDelay 后 ， 第 二 次 为 第 一 次 任务 执行 结 
人 与 Timer 不 同 ， 它 不 支持 以 绝对 时 间作 为 首次 运行 的 
时 间 。 


ScheduledExecutorService 的 主要 实现 类 是 
ScheduledThreadPoolExecutor， 它 是 线程 池 ThreadPoolExecutor 的 子 类 ， 
是 基于 线程 池 实 现 的 ， 它 的 主要 构造 方法 是 : 











public ScheduledThreadPoolExecutor(int corePoolSize) 





此 外 ， 还 有 构造 方法 可 以 接受 参数 ThreadFactory 和 


RejectedExecutionHandler， 含 义 与 ThreadPoolExecutor 一 样 ， 我 们 就 不 歼 
述 了 。 


它 的 任务 队列 是 一 个 无 界 的 优先 级 队列 ， 所 以 最 大 线程 数 对 它 没 有 
作用 ， 即 使 core-PoolSize 设 为 0， 它 也 会 至 少 运行 一 个 线程 。 


工厂 类 Executors 也 提供 了 一 些 方 便 的 方法 ， 以 方便 创建 
ScheduledThreadPoolExecutor， 如 下 所 示 : 








// 单 线程 的 定时 任务 执行 服务 
public static ScheduledExecutorService newSingleThreadScheduledExecutor() 
public static ScheduledExecutorService newSingleThreadScheduledExecutor( 
ThreadFactory threadFactory) 
// 多 线程 的 定时 任务 执行 服务 
public static ScheduledExecutorService newScheduledThreadPool( 
int corePoolSize) 
public static ScheduledExecutorService newScheduledThreadPool( 
int corePoolSize, ThreadFactory threadFactory) 











2. 其 本 示例 

由 于 可 以 有 多 个 线程 执行 定时 任务 ， 一 般 任务 就 不 会 被 某 个 长 时 间 
运行 的 任务 所 延迟 了 。 比 如 ， 对 于 代码 清单 18-4 所 示 的 
TimerFixedDelay， 如 果 改 为 代码 清单 18-8 所 示 : 


代码 清单 18-8 多 线程 的 定时 任务 执行 服务 示例 





public class ScheduledFixedDelay { 
static class LongRunningTask implements Runnable { 


// 省 略 ， 与 代码 清单 18- 4 一样 


static class FixedDelayTask implements Runnable { 


// 省 略 ， 与 代码 清单 18-4 一 样 














public static void main(String[] args) throws InterruptedException { 
ScheduledExecutorService timer = Executors 
.NewSscheduledThreadPoo]l1(10); 
timer.schedule(new LongRunningTask(), 10, TimeUnit.MILLISECONDS); 
timer.schedulewithFixedDelay(new FixedDelayTask(), 100, 1000, 
TimeUnit .MILLISECONDS ) ， 





再 次 执行 ， 第 二 个 任务 就 不 会 被 第 一 个 任务 延迟 了 。 





另外 ， 与 Timer 不 同 ， 单 个 定时 任务 的 异常 不 会 再 导致 整个 定时 任 
即使 后 台 只 有 一 个 线程 执行 任务 。 我 们 看 个 例子 ， 如 代码 清 
18-9 有 所 不 。 


代码 清单 18-9 ScheduledExecutorService 异 常 示例 





public class ScheduledException { 
static class TaskA implements Runnable { 
@Override 
public void run() { 
System.out.printin("task A"); 
} 


static class TaskB implements Runnable { 
@Override 
public void run() { 
System.out.printin("task B"); 
throw new RuntimeException(); 


} 


public static void main(String[] args) throws InterruptedException { 
ScheduledExecutorService timer = Executors 
.NewSingleThreadSscheduledExecutor(); 
timer.schedulewithFixedDelay(new TaskA(), 0, 1, TimeUnit.SECONDS); 
timer.schedulewithFixedDelay(new TaskB(), 2, 1, TimeUnit.SECONDS); 
} 
} 





TaskA 和 TaskB 都 是 每 秒 执行 一 次 ，TaskB 两 秒 后 执行 ， 但 一 执行 就 
抛 出 寞 第 ， 屏 大 的 输出 类 似 如 下 : 





task A 
task A 
task B 
task A 
task A 





这 说 明 ， 定时 任务 TaskB 被 取消 了 ， 但 TaskA 不 受 影响 ， 即使 它们 
是 由 同一 个 线程 执行 的 。 不 过 ， 需 要 强调 的 是 ， 与 Timer 不 同 ， 没 有 异 
党 被 抛 出 ，TaskB 的 异常 没有 在 任何 地 方 体现 。 所 以 ， 与 Timer 中 的 任务 
类 似 ， 应 该 捕获 所 有 异常 。 


3. 基 本 原理 


ScheduledThreadPoolExecutor 的 实现 思路 与 Timer 基 本 是 类 似 的 ， 都 








有 一 个 荃 于 堆 的 优先 级 队列 ， 你 存 待 热 行 的 定时 任务 ， 它 的 主要 个 同 
AE: 





1) 它 的 背后 是 线程 池 ， 可 以 有 多 个 线程 执行 任务 。 

2) 它 在 任务 执行 后 再 设置 下 次 执行 的 时 间 ， 对 于 固定 延 时 的 任务 
更 为 合理 。 

3) 任务 执行 线程 会 捕获 任务 执行 过 程 中 的 所 有 异常 ， 一 个 定时 任 


务 的 寞 第 不 会 影响 其 他 定时 任务 ， 不 过 ， 发 生 异 常 的 任务 (即使 是 一 个 
重复 任务 ) 不 会 再 被 调度 。 





18.3.3 四 竺 


本 节 介 绍 了 Java 中 定时 任务 的 两 种 实现 方式 : Timer 和 
ScheduledExecutorService， 需 要 特别 注意 Timer 的 一 些 陷阱 ， 实 践 中 建 
议 使 用 ScheduledExecutorService。 


它们 的 共同 局 限 是 不 太 胜 任 复杂 的 定时 任务 调度 。 比 如 ， 每 周一 和 
周三 晚上 18: 00 到 22: 00， 每 半 小 时 执行 一 次 。 对 于 类 似 这 种 需求 ， 可 
以 利用 我 们 之 前 在 第 7 章 介 绍 的 日 期 和 时 间 处 理 方法 ， 或 者 利用 更 为 强 
大 的 第 三 方 类 库 ， 比 如 Quartz (http://www.quartz-scheduler.org/ ) 。 


在 并 发 应 用 程序 中 ， 一 般 我 们 应 该 尽量 利用 高 层次 的 服务 ， 比 如 各 
种 并 发 容器 、 任 务 执行 服务 和 线程 池 等 ， 避 免 自 己 管理 线程 和 它们 之 间 
的 同步 。 但 在 个 别 情况 下 ， 自 己 管理 线程 及 同步 是 必需 的 ， 这 时 ， 除 了 
利用 前 面 章节 介绍 的 synchronized 显 式 锁 和 条 件 等 基本 工具 ，Java 并 发 包 
2 以 方便 实现 并 发 应 用 ， 让 我 们 下 
一 章 来 了 解 它们 。 














第 19 半 同步 和 协作 工具 类 


我 们 在 15.3 节 实现 了 线程 的 一 些 基 本 协作 机 制 ， 那 是 利用 基本 的 
waitnotify 实 现 的 。 我 们 提 到 ，Java 并 发 包 中 有 一 些 专门 的 同步 和 协作 工 
有 具 类 ， 本 章 ， 我 们 就 来 探讨 它们 。 有 具体 工具 类 包括 : 





' 读 写 锁 ReentrantReadWriteLock。 
.信号 量 Semaphore。 

.倒计时 门 检 CountDownLatch 。 
-循环 栅栏 CyclicBarrier。 


此 外 ， 有 一 个 实现 线程 安全 的 特殊 概念 : 线程 本 地 变量 
ThreadLocal， 本 章 也 会 进行 介绍 。 


与 第 15 章 介绍 的 显 式 锁 和 显 式 条 件 类 似 ， 除 了 ThreadLocal 外 ， 这 些 
同步 和 协作 类 都 是 基于 AQS 实 现 的 。 在 一 些 特定 的 同步 协作 场景 中 ， 相 
比 使 用 最 基本 的 waitnotify 以 及 显 式 锁 / 条 件 ， 它 们 更 为 方便 ， 效 率 更 
高 。 下 面 ， 我 们 就 来 探讨 它们 的 基本 概念 、 用 法 、 用 途 和 基本 原理 。 


19.1 读 写 锁 ReentrantReadWriteLock 


之 前 章节 我 们 介绍 了 两 种 锁 : synchronized 和 显 式 锁 
ReentrantLock， 对 于 同一 受 保 护 对 象 的 访问 ， 无 论 是 读 还 是 号 ， 它 们 都 
要 求 获 得 相同 的 锁 。 在 一 些 场景 中 ， 这 是 没有 必要 的 ， 多 个 线程 的 读 操 
作 完 全 可 以 并 行 ， 在 读 多 写 少 的 场景 中 ， 让 读 操作 并 行 可 以 明显 提高 性 
能 。 

怎么 让 读 操 作 能 够 并 行 ， 又 不 影响 一 致 性 昵 ? 答案 是 使 用 读 写 锁 。 


在 Java 并 发 包 中 ， 接 口 ReadWriteLock 表 示 读 写 锁 ， 主 要 实现 类 是 可 重 入 
读 写 锁 ReentrantReadWriteLock。ReadWriteLock 的 定义 为 : 














public interface ReadwWriteLock { 
Lock readLock(); 
Lock writeLock(); 


} 





通过 一 个 ReadWriteLock 产 生 两 个 锁 : 一 个 读 锁 ， 一 个 写 锁 。 读 操 
作 使 用 读 锁 ， 写 操作 使 用 写 锁 。 需 要 注意 的 是 ， 只 有 “ 读 - 读 ”操作 是 可 
以 并 行 的 ，“ 读 - 写 ” 和 “ 写 - 写 ”都 不 可 以 。 只 有 一 个 线程 可 以 进行 写 操 
作 ， 在 获取 写 锁 时 ， 只 有 没有 任何 线程 持 有 任何 锁 才 可 以 获取 到 ， 在 持 
有 写 锁 时 ， 其 他 任何 线程 都 获取 不 到 任何 锁 。 在 没有 其 他 线程 持 有 写 锁 
的 情况 下 ， 多 个 线程 可 以 获取 和 持 有 该 锁 。 


ReentrantReadWriteLock 是 可 重 入 的 读 写 锁 ， 它 有 两 个 构造 方法 ， 
如 下 所 示 : 














public ReentrantLock() 
public ReentrantLock(boolean fair) 








fire 表 示 古 合 公平 ， 如 果 不 传递 则 是 false， 含 义 与 16.2 节 介绍 的 类 
似 ， 就 不 歼 述 了 。 


我 们 看 个 读 写 锁 的 应 用 ， 使 用 ReentrantReadWriteLock 实 现 一 个 组 
存 类 MyCache， 如 代码 清单 19-1 所 示 。 


代码 清单 19-1 使 用 读 写 锁 实 现 一 个 缓存 类 MyCache 





public class MyCache { 
private Map<String, Object> map = new HashMap<>(); 
private ReentrantReadwriteLock readwriteLock = 
new ReentrantReadwriteLock(); 
private Lock readLock = readwriteLock.readLock(); 
private Lock writeLock = readwriteLock.writeLock(); 
public Object get(String key) { 
readLock .lock( ); 
try { 
return map.get(key); 
} finally { 
readLock.unlock(); 


} 
public Object put(String key, Object value) { 
writeLock.1lock(); 
try { 
return map.put(key, value); 
} finally { 
writeLock.unlock(); 


} 
public void clear() { 
writeLock.1lock(); 
try { 
map.clear(); 
} finally { 
writeLock.unlock(); 





代码 比较 简单 ， 就 不 痪 述 了 。 读 写 锁 是 怎么 实现 的 呢 ? 读 锁 和 写 锁 
看 上 去 是 两 个 锁 ， 它 们 是 怎么 协调 的 ? 具体 实现 比较 复杂 ， 我 们 简 述 下 
其 思路 。 


内 部 ， 它 们 使 用 同一 个 整数 变量 表示 锁 的 状态 ，16 位 给 读 锁 用 ，16 
ee 
写 锁 的 获取 ， 就 是 确保 当前 没有 其 他 线程 持 有 任何 锁 ， 人 否则 就 等 
写 锁 释放 后 ， 也 就 是 将 等 待 队 列 中 的 第 一 个 线程 唤醒 ， 唤 醒 的 可 能 


等 待 读 锁 的 ， 也 可 能 是 等 竺 写 锁 的 。 


读 锁 的 获取 不 太一 样 ， 首 和 抑 ， 只 要 写 锁 没 有 被 持 有 ， 就 可 以 获取 到 
读 锁 ， 此 外 ， 在 获取 到 读 锁 后 ， 它 会 检查 等 竺 队列 ， 逐 个 唤醒 最 前 面 的 





AY 


es 





等 得 读 锁 的 线程 ， 直 到 第 一 个 等 得 写 锁 的 线程 。 如 末 有 其 他 线程 持 有 瑟 
锁 ， 获 取 读 锁 会 等 等 。 读 锁 释 放 后 ， 检 查 读 锁 和 写 锁 数 是 否 都 变 为 了 
0， 如 果 是 ， 唤 醒 等 待 队列 中 的 下 一 个 线程 。 


19.2 ”信号 量 Semaphore 





之 前 介绍 的 锁 都 是 限制 只 有 一 个 线程 可 以 同时 访问 一 个 资源 。 现 实 
中 ， 资 源 往往 有 多 个 ， 但 每 个 同时 只 能 被 一 个 线程 访问 ， 比 如 ， 饭 店 的 
饭桌 、 火 车 上 的 卫生 间 。 有 的 单个 资源 即使 可 以 被 并 发 访问 ， 但 并 发 访 
问 数 多 了 可 能 影响 性 能 ， 所 以 希望 限制 并 发 访问 的 线程 数 。 还 有 的 情 
对 不 同等 级 的 账户 ， 限 制 不 同 的 最 大 并 
访问 数 。 


信号 量 类 Semaphore 残 是 用 来 解决 这 类 问题 的 ， 它 可 以 限制 对 资源 
的 并 发 访问 数 ， 它 有 两 个 构造 方法 : 














public Semaphore(int permits ) 
public Semaphore(int permits, boolean fair) 








fire 表 示 公 平 ， 含 义 与 之 前 介绍 的 是 类 似 的 ，permits 表 示 许 可 数 


呈 





Semaphore 的 方法 与 锁 是 类 似 的 ， 主 要 的 方法 有 两 类 ， 获 取 许 可 和 
释放 许可 ， 主 要 方法 有 : 








// 阻 塞 获 取 许 可 

public void acquire() throws InterruptedException 

// 阻 塞 获取 许可 ， 不 响应 中 断 

public void acquireUninterruptibly() 

// 批 量 获 取 多 个 许可 

public void acquire(int permits) throws InterruptedException 

public void acquireUninterruptibly(int permits) 

// 尝 试 获取 

public boolean tryAcquire() 

// 限 定 等 待 时 间 获 取 

public boolean tryAcquire(int permits, long timeout, 
TimeUnit unit) throws InterruptedException 

// 释 放 许 可 

public void release() 















































五 





我 们 看 个 简单 的 示例 ， 限 制 并 发 访问 的 用 户 数 不 超过 100， 如 代码 
清单 19-2 所 示 。 


代码 清单 19-2 ”Semaphore 应 用 示例 





public class AccessControlService { 
public static class ConcurrentLimitException extends RuntimeException { 
private static final long serialVersionUID = 1L， 


} 
private static final int MAX_ PERMITS = 100; 
private Semaphore permits = new Semaphore(MAX_ PERMITS, true); 
public boolean login(String name, String password) { 
if(!permits.tryAcquire()) { 
// 同 时 登录 用 户 数 超过 限制 
throw new ConcurrentLimitException(); 





























} 
//.… 其 他 验证 
return true,; 


} 
public void logout(String name) { 
permits.release(); 





代码 比较 简单 ， 就 不 歼 述 了 。 需 要 说 明 的 是 ， 如 果 我 们 将 permits 的 
值 设 为 1， 你 可 能 会 认为 它 承 变 成 了 一 般 的 锁 ， 不 过 ， 它 与 一 般 的 锁 是 
不 同 的 。 一 般 锁 只 能 由 持 有 锁 的 线程 释放 ， 而 Semaphore 表 示 的 只 是 一 
个 许可 数 ， 任 意 线程 都 可 以 调用 其 release 方 法 。 主 要 的 锁 实 现 类 
ReentrantLock 是 可 重 入 的 ， 而 Semaphore 不 是 ， 每 一 次 的 acquire 调 用 都 
会 消耗 一 个 许可 ， 比 如 ， 看 下 面 的 代码 段 : 





Semaphore permits = new Semaphore(1); 
permits.acquire(); 

permits.acquire(); 
System.out.println("acquired"); 





程序 会 阻塞 在 第 二 个 acquire 调 用 ， 永 远 都 不 会 输出 “acquired”。 


言 号 量 的 基本 原理 比较 简单 ， 也 是 基于 AQS 实 现 的 ，permits 表 示 共 
享 的 锁 个 数 ，acquire 方 法 就 是 检查 锁 个 数 是 否 大 于 0， 大 于 则 减 一 ， 获 
取 成 功 ， 否 则 就 等 待 ，release 就 是 将 锁 个 数 加 一 ， 唤 醒 第 一 个 等 待 的 线 
程 。 











19.3 ”倒计时 门 检 CountDownLatch 


我 们 在 15.3.5 节 使 用 wait/notify 实 现 了 一 个 简单 的 门 栓 MyLatch， 我 
们 提 到 ，Java 并 发 包 中 己 经 提供 了 类 似 工 具 ， 束 是 CountDownLatch。 它 
相当 于 是 一 个 门 栓 ， 一 开始 是 关闭 的 ， 所 有 希望 通过 该 门 的 线程 都 需要 
等 待 ， 然 后 开始 倒计时 ， 倒 计时 变 为 0 后 ， 门 栓 打 开 ， 等 待 的 所 有 线程 
都 可 以 通过 ， 它 是 一 次 性 的 ， 打 开 后 就 不 能 再 关上 了 。 


CountDownLatch 里 有 一 个 计数 ， 这 个 计数 通过 构造 方法 进行 传递 : 








public CountDownLatch(int count) 





多 个 线程 可 以 基于 这 个 计数 进行 协作 ， 它 的 主要 方法 有 : 





public void await() throws InterruptedException 
public boolean await(long timeout, TimeUnit unit) throws InterruptedException 
public void countDown() 





await 检 查 计数 是 否 为 0， 如 果 大 于 0， 束 等 待 ，await 可 以 被 中 断 ， 
也 可 以 设置 最 长 等 待 时 间 。countDown 检 查 计数 ， 如 果 已 经 为 0， 直 接 返 
， 人 否则 减少 计数 ， 如 果 新 的 计数 变 为 0， 则 唤醒 所 有 等 竺 的 线程 。 


之 前 ， 我 们 介绍 了 门 栓 的 两 种 应 用 场景 : 一 种 是 同时 开始 ， 另 一 种 
是 主 从 协作 。 它 们 都 有 两 类 线程 ， 互 相 需 要 同步 ， 我 们 使 用 
CountDownLatch 重 新 演示 。 

在 同时 开始 场景 中 ， 运 行 员 线程 等 待 主 裁判 线程 发 出 开始 指令 的 信 
号， 一 旦 发 出 后 ， 所 有 运动 员 线 程 同 时 开始 ， 计 数 初始 为 1， 运 动员 线 
程 调 用 await， 主 线程 调用 countDown， 如 代码 清单 19-3 所 示 。 


代码 清单 19-3 ”使 用 CountDownLatch 实 现 同时 开始 场景 











public class RacerwWithCcountDownLatch { 
static class Racer extends Thread { 
CountDownLatch latch,; 
public Racer(CountDownLatch latch) { 


this.latch = latch,; 


@Override 
public void run() { 
try { 
this.1latch.await(); 
System,out.printJln(getName() 
+ " Start run "+System.currentTimeMillis()); 
} catch (InterruptedException e) { 
} 
} 


public static void main(String[] args) throws InterruptedException { 
int num = 10; 
CountDownLatch latch = new CountDownLatch(1); 
Thread[] racers = new Thread[num]; 
for(int i = 0; i < num; i++) { 
racers[i] = new Racer(latch); 
racers[i].start(); 


} 
Thread.sleep(1000); 
latch.countDown(); 





代码 比较 简单 ， 束 不 袭 述 了 。 在 主 从 协作 模式 中 ， 主 线程 依赖 工作 
线程 的 结果 ， 需 要 等 待 工作 线程 结束 ， 这 时 ， 计 数 初 始 值 为 工作 线程 的 
个 数 ， 工 作 线 程 结束 后 调用 count-Down， 主 线程 调用 await 进 行 等 待 ， 如 
代码 清单 19-4 所 示 。 


代码 清单 19-4 使 用 CountDownLatch 实 现 主 从 协作 场景 








public class MasterworkerDemo { 
static class Worker extends Thread { 
CountDownLatch latch,; 
public Worker(CountDownLatch latch) { 
this.latch = latch,; 


@Override 
public void run() { 
try { 
// 模 拟 执 行 任务 
Thread.sleep((int) (Math.random() * 1000)); 
// 模 拟 异常 情况 
if(Math.random() < 0.02) { 
throw new RuntimeException("bad luck"); 





} 
} catch (InterruptedException e) { 
} finally { 
this.1latch.countDown( ); 
} 


} 


public static void main(String[] args) throws InterruptedException { 


int workerNum = 100 
CountDownLatch latch = new CountDownLatch(workerNum ) ; 
Worker[] workers = new Worker[workerNum] 
for(int i = 0; i < workerNum; i++) { 
workers[i] = new Worker(latch); 
workers[i].start(); 


latch.await(); 
System,.out.printJln("collect worker results"); 





需要 强调 的 是 ， 在 这 里 ，countDown 的 调用 应 该 放 到 finally 语 句 
中 ， 确 保 在 工作 线程 发 生 异 各 的 情况 下 也 会 被 调用 ， 使 主线 程 能 够 从 
await 调 用 中 返回 。 


19.4 循环 栅栏 CyclicBarrier 


我 们 在 15.3.7 节 使 用 wait/notify 实 现 了 一 个 简单 的 集合 点 
AssemblePoint， 我 们 提 到 ，Java 并 发 包 中 已 经 提供 了 类 似 工 具 ， 就 是 
CyclicBarrier。 它 相当 于 是 一 个 栅栏 ， 所 有 线程 在 到 达 该 栅栏 后 都 需要 
等 待 其 他 线程 ， 等 所 有 线程 都 到 达 后 再 一 起 通过 ， 它 是 循环 的 ， 可 以 用 
作 重 复 的 同步 。 


CydlicBarrier 特 别 适用 于 并 行 渤 代 计算 ， 每 个 线程 负责 一 部 分 计 
算 ， 然 后 在 栅栏 处 等 待 其 他 线程 完成 ， 所 有 线程 到 齐 后 ， 交 换 数 据 和 计 
算 结果 ， 再 进行 下 一 次 兴 代 ， 


与 CountDownLatch 类 似 ， 它 也 有 一 个 数字 ， 但 表示 的 是 参与 的 线程 
个 数 ， 这 个 数字 通过 构造 方法 进行 传递 











public CyclicBarrier(int parties) 





它 还 有 一 个 构造 方法 ， 接 受 一 个 Runnable 参 数 ， 如 下 所 示 : 





public CyclicBarrier(int parties, Runnable barrierAction) 





这 个 参数 表示 栅栏 动作 ， 当 所 有 线程 到 达 栅 栏 后 ， 在 所 有 线程 执行 
了 运行 参数 中 的 动作 ， 这 个 动作 由 最 后 一 个 到 达 栅 栏 的 线 
时 执 行 。 


CyclicBarrier 的 主要 方法 就 是 await: 








public int await() throws InterruptedException, BrokenBarrierException 
public int await(long timeout, TimeUnit unit) throws InterruptedException, 
BrokenBarrierException, TimeoutException 








await 在 等 待 其 他 线程 到 达 栅 栏 ， 调 用 await 后 ， 表 示 自 己 已 经 到 
达 ， 如 采 目 己 是 最 后 一 个 到 达 的 ， 束 执行 可 选 的 命令 ， 执 行 后 ， 唤 醒 所 
有 等 竺 的 线程 ， 然 后 重 置 内 部 的 同步 计数 ， 以 循环 使 用 。 





await 可 以 被 中 断 ， 可 以 限定 最 长 等 竺 时间， 中断 或 超时 后 会 抛 出 异 
常 。 需 要 说 明 的 是 异常 BrokenBarrierException， 它 表示 栅栏 被 破坏 了 ， 
什么 意思 呢 ? 在 CyclicBarrier 中 ， 参 与 的 线程 是 互相 影响 的 ， 只 要 其 中 
一 个 线程 在 调用 await 时 被 中 断 了 ， 或 者 超时 了 ， 栅 栏 就 会 被 破坏 。 此 
外 ， 如 果 栅 栏 动作 抛 出 了 腊 常 ， 栅 栏 也 会 被 破坏 。 被 破坏 后 ， 所 有 在 调 
用 await 的 线程 就 会 退出 ， 抛 出 BrokenBarrierException 。 


我 们 看 一 个 简单 的 例子 ， 多 个 游客 线程 分 别 在 集合 点 A 和 B 同 步 ， 
如 代码 清单 19-5 所 示 。 


代码 清单 19-5 ”CyclicBarrier 应 用 示例 





public class CyclicBarrierDemo { 
static class Tourist extends Thread { 
CyclicBarrier barrier,; 
public Tourist(CyclicBarrier barrier) { 
this.barrier = barrier; 


@Override 
public void run() { 
try 








{ 
// 模 拟 先 各 自 独立 运行 
Thread.sleep((int) (Math.random() * 1000)); 
// 集 合 点 A 
barrier.await(); 
System.out.printin(this.getName() + " arrived A " 
+ System.currentTimeMillis( )); 
// 集 合 后 模拟 再 各 自 独立 运行 
Thread.sleep((int) (Math.random() * 1000)); 
// 集 合 点 B 
barrier .await(); 
System.out.printin(this.getName() + " arrived B " 
+ System.currentTimeMillis( )); 
} catch (InterruptedException e) { 
} catch (BrokenBarrierException e) { 















































} 


public static void main(String[] args) { 
int num = 3; 
Tourist[] threads = new Tourist[num]; 
CyclicBarrier barrier = new CyclicBarrier(num, new Runnable() { 
@Override 
public void run() { 
System.out.println("all arrived " + System.currentTimeMillis() 
+ " executed by " + Thread.currentThread().getName()); 


} 

}); 

for(int i = 0; i < num; i++) { 
threads[i] = new Tourist(barrier); 
threads[i].start(); 





在 笔者 的 计算 机 中 的 一 次 输出 为 : 





all arrived 1490053578552 executed by Thread-1 
Thread-1 arrived A 1490053578555 
Thread-2 arrived A 1490053578555 
Thread-0 arrived A 1490053578555 
all arrived 1490053578889 executed by Thread-0 
Thread-0 arrived B 1490053578890 
Thread-2 arrived B 1490053578890 
Thread-1 arrived B 1490053578890 





多 个 线程 到 达 A 和 B 的 时 间 是 一 样 的 ， 使 用 CyclicBarrier， 达 到 了 重 
复 同步 的 目的 。 


CydlicBarrier 与 CountDownLatch 可 能 容易 混淆 ， 我 们 强调 下 它们 的 

1) CountDownLatch 的 参与 线程 是 有 不 同 角色 的 ， 有 的 负责 倒 计 
时 ， 有 的 在 等 竺 倒计时 变 为 0， 负 责 倒计时 和 等 待 倒计时 的 线程 都 可 以 
有 多 个 ， 用 于 不 同 角 色 线 程 间 的 同步 。 


2) CyclicBarrier 的 参与 线程 角色 是 一 样 的 ， 用 于 同一 角色 线程 间 的 
协调 一 致 。 


3) CountDownLatch 是 一 次 性 的 ， 而 CyclicBarrier 是 可 以 重复 利用 
的 。 





19.5 理解 ThreadLocal 


本 市 ， 我 们 来 探讨 一 个 特殊 的 概念 线程 本 地 变量 。 在 Java 中 的 实 
现 是 类 ThreadLocal， 它 是 什么 ?有 什么 用 ?实现 原理 是 什么 ? 让 我 们 接 
下 来 逐步 探讨 。 


19.5.1 基本 概念 和 用 法 


线程 本 地 变量 是 说 ， 每 个 线程 都 有 同一 个 变量 的 独 有 拷贝 。 这 个 
概念 听 上 去 比较 难以 理解 ， 我 们 先 直 接 来 看 类 TheadLocal 的 用 法 。 
ThreadLocal 是 一 个 泛 型 类 ， 接 受 一 个 类 型 参数 T， 它 只 有 一 个 空 的 构造 
方法 ， 有 两 个 主要 的 public 方 法 : 





public T get() 
public void set(T value) 





set 束 是 设置 值 ，get 就 是 获取 值 ， 如 果 没 有 值 ， 返 回 null， 看 上 去 ， 
ThreadLocal 就 是 一 个 单一 对 象 的 容器 ， 比 如 : 





public static void main(String[] args) { 
ThreadLocal<Integer> local = new ThreadLocal<>(); 
local.set(100); 
System.out.printilin(local.get()); 





输出 为 100。 那 ThreadLocal 有 什么 特殊 的 呢 ? 特 殊 发 生 在 有 多 个 线 
程 的 时 候 ， 看 个 例子 : 





public class ThreadLocalBasic { 
static ThreadLocal<Integer> local = new ThreadLocal<>(); 
public static void main(String[] args) throws InterruptedException { 
Thread child = new Thread() { 
@Override 
public void run() { 
System.out.printin("child thread initial: " + local.get()); 
local.set(200); 
System.out.printin("child thread final: " + local.get()); 
} 
}; 


local.set(100); 

child.start(); 

child.join(); 

System.out.printin("main thread final: " + local.get()); 





local 是 一 个 静态 变量 ，main 方 法 创建 了 一 个 子 线程 child，main 和 和 
child 都 访问 了 local， 程 序 的 输出 为 : 





child thread initial: null 
child thread final: 200 
main thread final: 100 





这 说 明 ，main 线 程 对 local 变 量 的 设置 对 child 线 程 不 起 作用 ，child 线 
程 对 local 变 量 的 改变 也 不 会 影响 main 线 程 ， 它 们 访问 的 虽然 是 同一 个 变 
量 local， 但 每 个 线程 都 有 上 自己 的 独立 的 值 ， 这 就 是 线程 本 地 变量 的 含 
i 





除了 getset，ThreadLocal 还 有 两 个 方法 : 





protected T initialValue() 
public void remove() 





initialValue 用 于 提供 初始 值 ， 这 是 一 个 受 保 护 方法 ， 可 以 通过 匿名 
内 部 类 的 方式 提供 ， 当 调用 get 方 法 时 ， 如 果 之 前 没有 设置 过 ， 会 调用 
该 方法 获取 初始 值 ， 默 认 实 现 是 返回 null。remove 删 掉 当 前 线程 对 应 的 
| 再 次 调用 get， 会 再 调用 initialValue 获 取 初 始 值 。 看 个 
简 量 儿 H 





public class ThreadLocalInit { 
static ThreadLocal<Integer> local = new ThreadLocal<Integer>(){ 
@Override 
protected Integer initialValue() { 
return 100; 


}; 

public static void main(String[] args) { 
System.out.printlin(local.get()); 
local.set(200); 
local.remove( ); 
System.out.printilin(local.get()); 


} 





输出 值 都 是 100。 
19.5.2 ”使 用 场景 


ThreadLocal 有 什么 用 呢 ? 我 们 来 看 三 个 例子 : 日 期 处 理 、 随 机 数 和 
上 下 文 信息 。 


1. 日 期 处 理 


ThreadLocal 是 实现 线程 安全 的 一 种 方案 ， 比 如 对 于 
DateFormat/SimpleDateFormat， 我 们 在 介绍 日 期 和 时 间 操 作 的 时 候 ， 提 
到 它们 是 非 线程 安全 的 ， 实 现 安全 的 一 种 方式 是 使 用 锁 ， 另 一 种 方式 是 
每 次 都 创建 一 个 新 的 对 象 ， 更 好 的 方式 就 是 使 用 ThreadLocal， 每 个 线程 
使 用 自己 的 DateFormat， 束 不 存在 安全 问题 了 ， 在 线程 的 整个 使 用 过 程 
中 ， 只 需要 创建 一 次 ， 又 避免 了 频繁 创建 的 开销 ， 示 例 代 人 码 如 下 : 





public class ThreadLocalDateFormat { 
static ThreadLocal<DateFormat> sdf = new ThreadLocal<DateFormat>() { 
@Override 
protected DateFormat initialValue() { 
return new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); 
} 


}; 
public static String date2String(Date date) { 
return sdf.get().format(date); 


public static Date string2Date(String str) throws ParseException { 
return sdf.get().parse(str); 
} 
} 





需要 说 明 的 是 ，ThreadLocal 对 象 一 般 都 定义 为 static， 以 便于 引 
用 。 


2. 随 机 数 


即使 对 象 是 线程 安全 的 ， 使 用 ThreadLocal 也 可 以 减少 竞争 ， 比 如 ， 
我 们 在 介绍 Random 类 的 时 候 提 到 ，Random 是 线程 安全 的 ， 但 如 果 并 发 
访问 竞争 激烈 的 话 ， 性 能 会 下 降 ， 所 以 Java 并 发 包 提 供 了 类 
ThreadLocalRandom， 它 是 Random 的 子 类 ， 利 用 了 ThreadLocal， 它 没有 


public 的 构造 方法 ， 通 过 静态 方法 current 获 取 对 象 ， 比 如 : 





public static void main(String[] args) { 
ThreadLocalRandom rnd = ThreadLocalRandom.current(); 
System.out.printilin(rnd.nextInt()); 





current 方 法 的 实现 为 : 





public static ThreadLocalRandom current() { 
return localRandom.get(); 





localRandom 就 是 一 个 ThreadLocal 变 量 : 





private static final ThreadLocal<ThreadLocalRandom> localRandom = 
new ThreadLocal<ThreadLocalRandom>() { 
protected ThreadLocalRandom initialValue() { 
return new ThreadLocalRandom( ); 


}; 





3. 上 下 文 信息 


ThreadLocal 的 典型 用 途 是 提供 上 下 文 信息 ， 比 如 在 一 个 Web 服 务 器 
中 ， 一 个 线程 执行 用 户 的 请 求 ， 在 执行 过 程 中 ， 很 多 代码 都 会 访问 一 些 
共同 的 信息 ， 比 如 请 求 信息 、 用户 号 份 信息 、 数 据 库 连接 、 当 前 事务 
等 ， 它 们 是 线程 执行 过 程 中 的 全 局 信息 ， 如 果 作 为 参数 在 不 同 代码 间 传 
递 ， 代 码 会 很 烦琐 ， 这 时 ， 使 用 ThreadLocal 就 很 方便 ， 所 以 它 被 用 于 各 
种 框架 如 Spring 中 。 我 们 看 个 简单 的 示例 ， 如 代码 清单 19-6 所 示 。 


代码 清单 19-6 ”使 用 ThreadLocal 保 存 上 下 文 信 息 














public class RequestContext { 
public static class Request { //... 


private static ThreadLocal<String> localUserId = new ThreadLocal<>(); 
private static ThreadLocal<Request> localRequest = new ThreadLocal<>(); 
public static String getCurrentUserId() { 

return localUserId.get(); 


public static void setCurrentUserId(String userId) { 


localUserId.set(userId); 


} 
public static Request getCurrentRequest() { 
return localRequest.get(); 


public static void setCurrentRequest(Request request) { 
localRequest.set(request); 
} 





在 首次 获取 到 信息 时 ， 调 用 set 方 法 如 
setCurrentRequest/setCurrentUserId 进 行 设置 ， 然 后 就 可 以 在 代码 的 任意 
其 他 地 方 调用 get 相 关 方 法 进行 获取 了 。 





19.5.3 ”基本 实现 原理 


ThreadLocal 是 怎么 实现 的 呢 ? 为 什么 对 同一 个 对 象 的 get/set， 每 个 
ae 己 独 立 的 值 昵 ?我 们 直接 来 看 代码 (基于 Java 7) 。set 方 
Y A: 尺码 大 和 





public void set(T value) { 
Thread t = Thread.currentThread(); 
ThreadLocalMap map = getMap(t); 
if(map != null) 
map.set(this, value); 
else 
createMap(t, value); 





它 调用 了 getMap，getMap 的 代码 为 : 





ThreadLocalMap getMap(Thread 七 ) { 
return t,threadLocals 
} 





返回 线程 的 实例 变量 threadLocals， 它 的 初始 值 为 null， 在 null 时 ， 
set 调 用 createMap 初 始 化 ， 代 码 为 : 





void createMap(Thread t, T firstValue) { 
t.threadLocals = new ThreadLocalMap(this, firstValue); 
} 





从 以 上 代码 可 以 看 出 ， 每 个 线程 都 有 一 个 Map， 类 型 为 
ThreadLocalMap， 调 用 set 实 际 上 是 在 线程 自己 的 Map 里 设置 了 一 个 条 
目 ， 键 为 当前 的 ThreadLocal 对 象 ， 值 为 value。ThreadLocalMap 是 一 个 
内 部 类 ， 它 是 专门 用 于 ThreadLocal 的 ， 与 一 般 的 Map 不 同 ， 它 的 键 类 型 
为 WeakReference<ThreadLocal>。 我 们 没有 提 过 WeakReference， 它 与 
ee 回收 机 制 有 关 ， 使 用 它 ， 便 于 回收 内 存 ， 具 体 我 们 束 不 探讨 


get 方 法 的 代码 为 : 





public T get() { 
Thread t = Thread.currentThread(); 
ThreadLocalMap map = getMap(t); 
if(map != null) { 
ThreadLocalMap.Entry e = map.getEntry(this); 
if(e != null) 
return (T)e.value; 


return setInitialValue(); 


} 





通过 线程 访问 到 Map， 以 ThreadLocal 对 象 为 键 从 Map 中 获取 到 条 
目 ， 取 其 value， 如 果 Map 中 没有 ， 则 调用 setInitialValue， 其 代码 为 : 








private T setIinitialValue() { 
T value = initialValue(); 
Thread t = Thread.currentThread(); 
ThreadLocalMap map = getMap(t); 
if(map != null) 
map.set(this, value); 
else 
createMap(t, value); 
return value; 





initialValue ( ) 束 是 之 前 提 到 的 提供 初始 值 的 方法 ， 默 认 实 现 束 是 
返回 null。 


remove 方 法 的 代码 也 很 直接 ， 如 下 所 示 : 





public void remove() { 
ThreadLocalMap m = getMap(Thread.currentThread()); 
if(m != null) 
m.remove(this); 





简单 总 结 下 ， 每 个 线程 都 有 一 个 Map， 对 于 每 个 ThreadLocal 对 象 ， 
调用 其 get/set 实 际 上 就 是 以 ThreadLocal 对 象 为 键 读 写 当前 线程 的 Map， 
这 样 ， 束 实现 了 每 个 线程 都 有 自己 的 独立 副本 的 效果 。 

本 章 介 绍 了 Java 并 发 包 中 的 一 些 同步 协作 工具 : 


1) 在 读 多 写 少 的 场景 中 使 用 ReentrantReadWriteLock 替 代 
ReentrantLock， 以 提高 性 能 。 


2) 使 用 Semaphore 限 制 对 资源 的 并 发 访问 数 。 
3) 使 用 CountDownLatch 实 现 不 同 角 色 线 程 间 的 同步 。 
4) 使 用 CyclicBarrier 实 现 同一 角色 线程 间 的 协调 一 致 。 


关于 ThreadLocal， 本 章 介 绍 了 它 的 基本 概念 、 用 法 用 途 和 实现 原 
理 ， 简单 总 结 来 说 : 


1) ThreadLocal 使 得 每 个 线程 对 同一 个 变量 有 上 自己 的 独立 副本 ,是 
实现 线程 安全 、 减 少 竞 争 的 一 种 方案 。 


2) ThreadLocal 经 常用 于 存储 上 下 文 信息 ， 避 人 免 在 不 同 代 人 码 间 来 回 
传递 ， 简 化 代码 。 


3) 每 个 线程 都 有 一 个 Map， 调 用 ThreadLocal 对 象 的 get/set 实 际 就 是 
以 ThreadLocal 对 象 为 键 读 写 当前 线程 的 该 Map。 


人 至此， 关于 并 及 就 介绍 完了 ， 下 一 章 ， 让 我 们 一 起 回顾 总 绪 一 下 。 





第 20 半 ”并 发 总 结 

从 第 15 章 到 第 19 章 ， 我 们 一 直 在 讨论 并 发 ， 本 章 进 行 简 要 总 结 。 多 
线程 开发 有 两 个 核心 问题 : 一 个 是 竞争 ， 另 一 个 是 协作 。 竞 争 会 出 现 线 
程 安全 问题 ， 所 以 ， 本 章 首 先 总 结 线程 安全 的 机 制 ， 然 后 是 协作 的 机 
制 。 管 理 竞争 和 协作 是 复杂 的 ， 所 以 Java 提 供 了 更 高 层次 的 服务 ， 比 如 
并 发 容器 类 和 异步 任务 执行 服务 ， 我 们 也 会 进行 总 结 。 本 章 纲要 如 下 : 

.线程 安全 的 机 制 ; 

.线程 的 协作 机 制 ; 

.容器 类 ; 


“任务 执行 服务 。 








20.1 线程 安全 的 机 制 


线程 表示 一 条 单独 的 执行 流 ， 每 个 线程 有 自己 的 执行 计数 器 ， 有 自 
己 的 栈 ， 但 可 以 共享 内 存 ， 共 享 内 存 是 实现 线程 协作 的 基础 ， 但 共享 内 
存 有 两 个 问题 ， 了 苋 态 条 件 和 内 存 可 见 性 ， 之 前 章节 探讨 了 解决 这 些 问题 
的 多 种 思路 : 

.使 用 Synchronized; 

.使 用 显 式 锁 ; 

.使 用 volatile; 

使 用 原子 变量 和 CAS; 

` 写 时 复制 ; 

.使 用 ThreadLocal。 

(1) synchronized 

synchronized 人 简单 易 用 ， 它 只 是 一 个 关键 字 ， 大 部 分 情况 下 ， 放 到 
类 的 方法 声明 上 就 可 以 了 ， 既 可 以 解决 函 态 条 件 问题 ， 也 可 以 解决 内 存 
可 见 性 问题 。 

需要 理解 的 是 ， 它 保护 的 是 对 象 ， 而 不 是 代码 ， 只 有 对 同一 个 对 象 
的 synchronized 方 法 调用 ，synchronized 才 能 保证 它们 被 顺序 调用 。 对 于 
实例 方法 ， 这 个 对 象 是 this;， 对 于 静态 方法 ， 这 个 对 象 是 类 对 象 ， 对 于 
代码 块 ， 需 要 指定 哪个 对 象 。 

另外 ， 需 要 注意 ， 它 不 能 答 试 获取 锁 ， 也 不 啊 应 中 断 ， 还 可 能 会 死 
锁 。 不 过 ， 相 比 显 式 锁 ，synchronized 人 简单 易 用 ，JVM 也 可 以 不 断 优 化 
它 的 实现 ， 应 该 被 优先 使 用 。 

(2) 显 式 锁 


显 式 锁 是 相对 于 synchronized 隐 式 锁 而 言 的 ， 它 可 以 实现 




















synchronized 同 样 的 功能 ， 但 需要 程序 员 上 自己 创建 锁 ， 调 用 锁 相 关 的 接 
口 ， 主 要 接口 是 Lock， 主 要 实现 类 是 Reen-trantLock。 


相 比 synchronized， 显 式 锁 文 持 以 非 阻塞 方式 获取 锁 ， 可 以 啊 应 中 
2 可 以 限时 ， 可 以 指定 公平 性 ， 可 以 解决 死 锁 问题 ， 这 使 得 它 灵 活 得 





在 读 多 写 少 、 读 操作 可 以 完全 并 行 的 场景 中 ， 可 以 使 用 读 写 锁 以 提 
高 并 发 度 ， 读 写 锁 的 接口 是 ReadWriteLock， 实 现 类 是 
ReentrantReadWriteLock。 


(3) volatile 


synchronized 和 显 式 锁 都 是 锁 ， 使 用 锁 可 以 实现 安全 ， 但 使 用 锁 是 
有 成 本 的 ， 获 取 不 到 锁 的 线程 还 需要 等 待 ， 会 有 线程 的 上 下 文 切 换 开 销 
等 。 保 证 安全 不 一 定 需要 锁 。 如 果 共 享 的 对 象 只 有 一 个 ， 操 作 也 只 是 进 
行 最 简单 的 get/set 操 作 ，set 也 不 依赖 于 之 前 的 值 ， 那 就 不 存在 范 态 条 件 
人 而 只 有 内 存 可 见 性 问题 ， 这 时 ， 在 变量 的 声明 上 加 上 volatile 就 可 
BAT 


(4) 原子 变量 和 CAS 


使 用 volatile，set 的 新 值 不 能 依赖 于 旧 值 ， 但 很 多 时 候 ，set 的 新 值 
与 原来 的 值 有 关 ， 这 时 ， 也 不 一 定 需要 锁 ， 如 果 需 要 同步 的 代码 比较 简 
单 ， 可 以 考虑 原子 变量 ， 它 们 包含 了 一 些 以 原子 方式 实现 组 合 操作 的 方 
产生 序列 号 等 需求 ， 考 虑 使 用 原子 变量 而 

人 人 o 


原子 变量 的 基础 是 CAS， 一 般 的 计算 机 系统 都 在 硬件 层次 上 直接 文 
持 CAS 指 令 。 通 过 循环 CAS 的 方式 实现 原子 更 新 是 一 种 重要 的 思维 。 相 
比 synchronized， 它 是 乐观 的 ， 而 synchronized 是 悲观 的 ， 它 是 非 阻塞 式 
鸣 ， 而 synchronized 是 阻 窜 式 的 。CAS 是 Java 并 发 包 的 基础 ， 基 于 它 可 以 
实现 高 效 的 、 乐 观 、 非 阻 罕 式 数 据 结 构 和 算法 ， 它 也 是 并 发 包 中 锁 、 同 
步 工具 和 各 种 容器 的 基础 。 


(5) 写 时 复制 
之 所 以 会 有 线程 安全 的 问题 ， 是 因为 多 个 线程 并 发 读 写 同 一 个 对 
































象 ， 如 有 果 每 个 线程 读 写 的 对 象 都 是 不 同 的 ， 或 者 ， 如 有 打 共 亨 访 问 的 对 象 
是 只 读 的 ， 不 能 修改 ， 那 也 就 不 存在 线程 安全 问题 了 。 


我 们 在 介绍 容 右 类 CopyOnWriteArrayList 和 CopyOnWriteArraySet 时 
介绍 了 与 时 复制 技术 ， 写 时 复制 就 是 将 共享 访问 的 对 象 变 为 只 读 的 ， 与 
的 时 候 ， 再 使 用 锁 ， 保 证 只 有 一 个 线程 号 ， 写 的 线程 不 是 直接 修改 原 对 
象 ， 而 是 新 创建 一 个 对 象 ， 对 该 对 象 修改 完毕 后 ， 再 原子 性 地 修改 共享 
访问 的 变量 ， 让 它 指向 新 的 对 象 。 


(6) ThreadLocal 


ThreadLocal 束 是 让 每 个 线程 ， 对 同一 个 变量 ， 都 有 目 己 的 独 有 副 
本 ， 每 个 线程 实际 访问 的 对 象 都 是 自己 的 ， 自 然 也 就 不 存在 线程 安全 问 


题 了 。 

















20.2 ”线程 的 协作 机 制 


多 线程 之 间 的 核心 问题 ， 除 了 竞争 ， 就 是 协作 。 我 们 在 15.3 节 介绍 
了 多 种 协作 场景 ， 比 如 生产 者 /消费 者 协作 模式 、 主 从 协作 模式 、 同 时 
开始 、 集 合 扣 等 。 之 前 章节 探讨 了 协作 的 多 种 机 制 : 


"wait/notify; 

"Rs 

线程 的 中 断 ; 

协作 工具 类 ; 

阻塞 队列 ; 

‘Future/FutureTask.。 
(1) wait/notify 


wait/notify 与 synchronized 配 合 一 起 使 用 ， 是 线程 的 基本 协作 机 制 。 
每 个 对 象 都 有 一 把 锁 和 两 个 等 竺 队列， 一 个 是 锁 等 竺 队列 ， 放 的 是 等 待 
获取 锁 的 线程 ， 另 一 个 是 条 件 等 待 队列 ， 放 的 是 等 待 条 件 的 线程 ，wait 
将 自己 加 入 条 件 等 待 队列 ，notify 从 条 件 等 待 队列 上 移 除 一 个 线程 并 唤 
醒 ，notifyAl 移 除 所 有 线程 并 唤醒 。 


需要 注意 的 是 ，wait/notify 方 法 只 能 在 synchronized 代 码 块 内 被 调 
用 ， 调 用 wait 时 ， 线 程 会 释放 对 象 锁 ， 被 notifynotifyAlH 唤 醒 后 ， 要 重新 
竞争 对 象 锁 ， 获 取 到 锁 后 才 会 从 wait 调 用 中 返回 ， 返 回 后 ， 不 代表 其 等 
待 的 条 件 就 一 定 成 芯 了 ， 需 要 重新 检查 其 等 待 的 条 件 。 


wait/notify 方 法 看 上 去 很 简单 ， 但 往往 难以 理解 wait 等 的 到 底 是 什 
么 ， 而 notify 通 知 的 又 是 什么 ， 只 能 有 一 个 条 件 等 待 队列 ， 这 也 是 
waitnotify 机 制 的 局 限 性 ， 这 使 得 对 于 等 待 条 件 的 分 析 变 得 复杂 ，15.3 节 
通过 多 个 例子 演示 了 其 用 法 ， 这 里 就 不 袭 述 了 ， 


(2) 显 式 条 件 




















显 式 条 件 与 显 式 锁 配合 使 用 ， 与 wait/notify 相 比 ， 可 以 支持 多 个 条 
件 队列 ， 代 码 更 为 易 读 ， 效 率 更 高 。 使 用 时 注意 不 要 将 signal/signalAll 
误 写 为 notify/notifyAll。 


(3) 线程 的 中 断 


Java 中 取消 /关闭 一 个 线程 的 方式 是 中 新。 中断 并 不 是 强迫 终止 一 个 
线程 ， 它 是 一 种 协作 机 制 ， 是 给 线程 传递 一 个 取消 信号 ， 但 是 由 线程 来 
决定 如 何以 及 何 时 退出 ， 线 程 在 不 同 状态 和 IO 操 作 时 对 中 断 有 不 同 的 及 
应 。 作 为 线程 的 实现 者 ， 应 该 提供 明确 的 取消 / 关 团 方法 ， 并 用 文档 清 
楚 描 述 其 行为 ， 作 为 线程 的 调用 者 ， 应 该 使 用 其 取消 /关闭 方法 ， 而 不 


是 贸然 调用 interrupt。 
(4) 协作 工具 类 


除了 基本 的 显 式 锁 和 条 件 ， 针 对 第 见 的 协作 场景 ，Java 并 发 包 提 供 
了 多 个 用 于 协作 的 工具 类 。 


信号 量 类 Semaphore 用 于 限制 对 资源 的 并 发 访问 数 。 


倒计时 门 栓 CountDownLatch 主 要 用 于 不 同 角 色 线 程 间 的 同步 ， 比 如 
在 裁判 /运动 员 模 式 中 ， 裁 判 线程 让 多 个 运动 员 线 程 同 时 开始 ， 也 可 以 
用 于 协调 主 从 线程 ， 让 主线 程 等 待 多 个 从 线程 的 结 


循环 栅栏 CyclicBarrier 用 于 同一 角色 线程 间 的 协调 一 致 ， 所 有 线程 
在 到 达 栅 栏 后 都 需要 等 待 其 他 线程 ， 等 所 有 线程 都 到 达 后 再 一 起 通过 ， 
它 是 人 循环 的 ， 可 以 用 作 重 复 的 同步 。 


(5) 阻塞 队列 


对 于 最 常见 的 生产 者 /消费 者 协作 模式 ， 可 以 使 用 阻塞 队列 ， 阻 赛 
队列 封装 了 锁 和 条 件 ， 生 产 者 线程 和 消费 者 线程 只 需要 调用 队列 的 入 
队 / 出 队 方 法 就 可 以 了 ， 不 需要 考虑 同步 和 协作 问题 。 


阻 考 队 列 有 普通 的 先进 先 出 队列 ， 包 括 基 于 数组 的 
ArrayBlockingQueue 和 基于 链表 的 
LinkedBlockingQueue/LinkedBlockingDeque， 也 有 基于 堆 的 优先 级 阻塞 
队列 PriorityBlock-ingQueue， 还 有 可 用 于 定时 任务 的 延 时 阻塞 队列 














DelayQueue， 以 及 用 于 特殊 场景 的 阻塞 队列 SynchronousQueue 和 


LinkedTransferQueue。 
(6) Future/FutureTask 


在 常见 的 主 从 协作 模式 中 ， 主 线程 往往 是 让 子 线 程 异步 执行 一 项 任 
务 ， 获 取 其 结果 。 手 工 创建 子 线程 的 写法 往往 比较 麻烦 ， 和 常见 的 模式 是 
使 用 异步 任务 执行 服务 ， 不 再 手工 创建 线程 ， 而 只 是 提交 任务 ， 提 交 后 
马上 得 到 一 个 结果 ， 但 这 个 结果 不 是 最 终结 果 ， 而 是 一 个 Future。 
Future 是 一 个 接口 ， 主 要 实现 类 是 FutureTask。 


Future 封 装 了 主线 程 和 执行 线程 关于 执行 状态 和 结果 的 同步 ， 对 于 
主线 程 而 言 ， 它 只 需要 通过 Future 就 可 以 查询 异步 任务 的 状态 、 获 取 最 
终结 果 、 取 消 任 务 等 ， 不 需要 再 考虑 同步 和 协作 问题 。 

















203 着 和 类 





线程 安全 的 容器 有 两 类 : 一 类 是 同步 容 圳 ; 另 一 类 是 并 发 容器 。 在 
15.2 市 ， 我 们 介绍 了 同步 容 莫 。 关 于 并 发 容 右 ， 我 们 介绍 了 : 


. 写 时 复制 的 List 和 Set。 





'ConcurrentHashMap。 
.基于 SkipList 的 Map 和 Set。 
各 种 队列 。 

(1) 同步 容 需 


Collections 类 中 有 一 些 静 态 方 法 ， 可 以 基于 普通 容器 返回 线程 安全 
的 同步 容器 ， 比如 : 








public static <T> Collection<T> synchronizedCollection(Collection<T> c) 
public static <T> List<T> synchronizedList(List<T> list) 
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) 





它们 是 给 所 有 容器 方法 都 加 上 synchronized 来 实现 安全 的 。 同 步 容 
器 的 性 能 比较 低 ， 另 外 ， 还 需要 注意 一 些 问 题 ， 比 如 复合 操作 和 迭代 ， 
需要 调用 方 手工 使 用 synchronized 同 步 ， 并 注意 不 要 同步 错 对 象 。 


而 并 发 容器 是 专 为 并 发 而 设计 的 ， 线 程 安 全 、 并 发 度 更 高 、 性 能 
高 、 迭 代 不 会 抛 出 ConcurrentModificationException、 很 多 容器 以 原子 方 
式 文 持 一 些 复合 操作 。 


(2) 写 时 复制 的 List 和 Set 


CopyOnWriteArrayList 基 于 数组 实现 了 List 接 口 ， 
CopyOnWriteArraySet 基 于 CopyOn-WriteArrayList 实 现 了 Set 接 口 ， 它 们 
采用 了 写 时 复制 ， 适 用 于 读 远 多 于 写 ， 集 合 不 太 大 的 场合 。 不 适用 于 数 
组 很 大 且 修 改 频繁 的 场景 。 它 们 是 以 优化 读 操 作为 目标 的 ， 读 不 需要 同 








步 ， 性 能 很 高 ， 但 在 优化 读 的 同时 牺牲 了 写 的 性 能 。 
(3) ConcurrentHashMap 


HashMap 不 是 线程 安全 的 ， 在 并 发 更 新 的 情况 下 ，HashMap 的 链表 
结构 可 能 形成 环 ， 出 现 死 循环 ， 占 满 CPU。ConcurrentHashMap 是 并 发 
版 的 HashMap， 通 过 细 粒 上 度 锁 和 其 他 技术 实现 了 局 并 发 ， 读 操作 完全 并 
行 ， 写 操作 支持 一 定 程 度 的 并 行 ， 以 原子 方式 文 持 一 些 复合 操作 ， 返 代 
不 用 加 锁 ， 不 会 抛 出 ConcurrentModificationException 。 


(4) 基于 SkipList 的 Map 和 Set 


ConcurrentHashMap 不 能 排序 ， 容 器 类 中 可 以 排序 的 Map 和 Set 是 
TreeMap 和 TreeSet， 但 它们 不 是 线程 安全 的 。Java 并 发 包 中 与 
TreeMap/TreeSet 对 应 的 并 发 版 本 是 Concurrent-SkipListMap 和 
ConcurrentSkipListSet。ConcurrentSkipListMap 是 基于 SkipList 实 现 的 ， 
Skip-List 称 为 跳跃 表 或 跳 表 ， 是 一 种 数据 结构 ， 主 要 操作 复杂 上 度 为 
O (log2 CN) ) 。 并 发 版 本 采用 跳 表 而 不 是 树 ， 是 因为 跳 表 更 易于 实 
现 高 效 并 发 算法 。 


ConcurrentSkipListMap 没 有 使 用 锁 ， 所 有 操作 都 是 无 阻塞 的 ， 所 有 
操作 都 可 以 并 行 ， 包 括 写 。 与 ConcurrentHashMap 类 似 ， 友 代 器 不 会 抛 
出 ConcurrentModificationException， 是 弱 一 致 的 ， 也 直接 文 持 一 些 原子 
复合 操作 。 


(5) 各 种 队列 


各 种 阻塞 队列 主要 用 于 协作 ， 非 阻塞 队列 适用 于 多 个 线程 并 发 使 用 
一 个 队列 的 场合 ， 有 两 个 非 阻塞 队列 : ConcurrentLinkedQueue 和 
ConcurrentLinkedDeque。Concurrent-LinkedQueue 实 现 了 Queue 接 口 ， 表 
示 一 个 先进 先 出 的 队列 ; ConcurrentLinkedDeque 实 现 了 Deque 接 口 ， 表 
示 一 个 双 端 队列 。 它 们 都 是 基于 链表 实现 的 ， 都 没有 限制 大 小 ， 是 无 界 
的 ， 这 两 个 类 最 基础 的 实现 原理 是 循环 CAS， 没 有 使 用 锁 。 








20.4 任务 执行 服务 


关于 任务 执行 服务 ， 我 们 介绍 了 : 

.任务 执行 服务 的 基本 概念 。 

主要 实现 方式 : 线程 池 。 

.定时 任务 。 

(1) 基本 概念 

任务 执行 服务 大 大 简化 了 执行 异步 任务 所 需 的 开发 ， 它 引入 了 一 
个 “执行 服务 ”的 概念 ， 将 “任务 的 提交 ”和 “任务 的 执行 2? 相 分 离 ,，“ 执 行 服 
务 ” 封 装 了 任务 执行 的 细节 ， 对 于 任务 提交 者 而 言 ， 它 可 以 关注 于 任务 
本 身 ， 如 提交 任务 、 获 取 结 果 、 取 消 任 务 ， 而 不 需要 关注 任务 执行 的 细 
节 ， 如 线程 创建 、 任 务 调度 、 线 程 关 闭 等 。 

任务 执行 服务 主要 涉及 以 下 接口 : 


.Runnable 和 Callable: 表示 要 执行 的 异步 任务 。 





.Executor 和 ExecutorService: 表示 执行 服务 。 
:Future: 表示 异步 任务 的 结 


使 用 者 只 需要 通过 ExecutorService 提 交 任 务 ， 通 过 Future 操 作 任 务 
和 结果 即 可 ， 不 需要 关注 线程 创建 和 协调 的 细节 。 


(2) 线程 池 


任务 执行 服务 的 主要 实现 机 制 是 线程 池 ， 实 现 类 是 
ThreadPoolExecutor。 线 程 池 主 要 由 两 个 概念 组 成 : 一 个 是 任务 队列 ; 
另 一 个 是 工作 者 线程 。 任 务 队 列 是 一 个 阻塞 队列 ， 保 存 待 执行 的 任务 。 
工作 者 线程 主体 就 是 一 个 循环 ， 循 环 从 队列 中 接收 任务 并 执行 。 
ThreadPool-Executor 有 一 些 重要 的 参数 ， 理 解 这 些 参 数 对 于 合理 使 用 线 
程 池 非常 重要 ，18.2 节 对 这 些 参数 进行 了 详细 介绍 。 





ThreadPoolExecutor 实 现 了 生产 者 /消费 者 模式 ， 工 作者 线程 就 是 消 
费 者 ， 任 务 提 交 者 就 是 生产 者 ， 线 程 池 目 己 维 护 任 务 队 列 。 当 我 们 碰 到 
类 似 生 产 者 /消费 者 问题 时 ， 应 该 优先 考虑 直接 使 用 线程 池 ， 而 非 “ 重 新 
发 明 轮 子 ”， 和 上 自己 管理 和 维护 消费 者 线程 及 任务 队列 。 


(3) 定时 任务 


异步 任务 中 ， 币 见 的 任务 是 定时 任务 。 在 Java 中 ， 有 两 种 方式 实现 
定时 任务 : 


1) 使 用 java.util 包 中 的 Timer 和 TimerTask。 














2) 使 用 Java 并 发 包 中 的 ScheduledExecutorService。 
Timer 有 一 些 需 要 特别 注意 的 事项 : 


1) 一 个 Timer 对 象 背后 只 有 一 个 Timer 线 程 ， 这 意味 着 ， 定 时 任务 
不 能 耗 时 太 长 ， 更 不 能 是 无 限 循环 。 


2) 在 执行 任何 一 个 任务 的 run 方 法 时 ， 一 旦 run 抛 出 异常 ，Timer 线 
程 就 会 退出 ， 从 而 所 有 定时 任务 都 会 被 取消 。 


ScheduledExecutorService 的 主要 实现 类 是 
ScheduledThreadPoolExecutor， 它 没有 Timer 的 问题 。 


1) 它 的 背后 是 线程 池 ， 可 以 有 多 个 线程 执行 任务 。 


2) 任务 执行 线程 会 捕获 任务 执行 过 程 中 的 所 有 异常 ， 一 个 定时 任 
务 的 异常 不 会 影响 其 他 定时 任务 。 

所 以 ， 实 践 中 建议 使 用 ScheduledExecutorService。 

针对 多 线程 开发 的 两 个 核心 问题 : 竞争 和 协作 ， 本 章 总 结 了 线程 安 
全 和 协作 的 多 种 机 制 ， 针 对 高 层 服务 ， 本 和 章 总 结 了 并 发 容器 和 任务 执行 
服务 ， 它 们 让 我 们 在 更 高 的 层次 上 访问 共享 的 数据 结构 ， 执 行 任 务 ， 而 
避免 陷入 线程 管理 的 细节 。 


有 一 些 并 发 的 内 容 ， 我 们 没有 讨论 ， 比 如 以 下 内 容 。 











1) Java7 引 入 的 Fork/Join 框 架 ，Java 8 中 有 并 行 流 的 概念 ， 可 以 让 
开发 者 非常 方便 地 对 大 量 数据 进行 并 行 操 作 ， 背 后 基于 的 束 是 Fork/Join 
框架 ， 关 于 流 我 们 在 第 26 章 会 进一步 介绍 。 


2) CompletionService， 在 异步 任务 程序 中 ， 一 种 场景 是 : 主线 程 
提交 多 个 异步 任务 ， 然 后 希望 有 任务 完成 就 处 理 结 果 ， 并 且 按 任务 完成 
顺序 逐个 处 理 ， 对 于 这 种 场景 ，Java 并 发 包 提 供 了 一 个 方便 的 方法 ， 那 
束 是 使 用 CompletionService。 这 是 一 个 接口 ， 它 的 实现 类 是 
ExecutorCompletionService， 它 通过 一 个 额外 的 结果 队列 ， 方 便 了 对 于 
多 个 异步 任务 结果 的 处 理 ， 细 节 可 参考 微 信 公 众 号 “ 老 马 说 编程 ?第 79 篇 
是 














3) Java 8 引入 组 合式 异步 编程 CompletableFuture， 它 可 以 方便 地 将 
多 个 有 一 定 依 赖 关 系 的 异步 任务 以 流水 线 的 方式 组 合 在 一 起 ， 自 然 地 表 
达 任 务 之 间 的 依赖 关系 和 执行 流程 ， 大 大 简化 代码 ， 提 高 可 读 性 。 关 于 
CompletableFuture， 我 们 也 到 第 26 章 介绍 。 


从 下 一 草 开 始 ， 我 们 来 探讨 Java 中 的 一 些 动态 特性 ， 比 如 反射 、 注 
解 、 动 态 代理 等 ， 它 们 到 底 是 什么 呢 ? 


.第 21 章 
.第 22 章 
:第 23 章 
:第 24 章 
:第 25 章 


:第 26 音 


第 六 部 分 “动态 与 图 数 式 编程 


类 加 载 机 制 
正则 表达 式 


第 21 章 ”反射 

从 本 章 开 始 ， 我 们 来 探讨 Java 中 的 一 些 动态 特性 ， 包 括 反 射 、 注 
解 、 动 态 代 理 、 类 加 载 器 等 。 利 用 这 些 特 性 ， 可 以 优雅 地 实现 一 些 灵 活 
通用 的 功能 ， 它 们 经 闻 用 于 各 种 框 娘 、 库 和 系统 程序 中 ， 比 如 : 


0 
| 。 

2) 有 多 种 库 〈 如 Spring MVC、Jersey) 用 于 处 理 Web 请 求 ， 利 用 反 
射 和 注解 ， 能 方便 地 将 用 户 的 请 求 参 数 和 内 容 转换 为 Java 对 象 ， 将 Java 
对 象 转变 为 啊 应 内 容 。 


3) 有 多 种 库 〈 如 Spring、Guice) 利用 这 些 特 性 实现 了 对 象 管理 容 
上 器 ， 方 便 程 序 员 管理 对 象 的 生命 周期 以 及 其 中 复杂 的 依赖 关系 。 


4) 应 用 服务 器 (如 Tomcat) 利用 类 加 载 器 实现 不 同 应 用 之 间 的 隔 
离 ，JSP 技 术 利 用 类 加 载 器 实现 修改 代码 不 用 重 局 就 能 生效 的 特性 。 


5) 面向 方面 的 编程 AOP (Aspect Oriented Programming) 将 编程 中 
通用 的 关注 点 《如 日 志 记 录 、 和 安全 检查 等 ) 与 业务 的 主体 逻辑 相 分 离 ， 
减少 见 余 代码 ， 提 高 程序 的 可 维护 性 ，AOP 需 要 依赖 上 面 的 这 些 特 性 来 
实现 。 

本 章 主 要 介绍 反射 机 制 ， 后 续 章 节 介 绍 其 他 内 容 。 


在 一 般 操 作 数 据 的 时 候 ， 我 们 都 是 知道 并 且 依赖 于 数据 类 型 的 ， 比 
0D: 


1) 根据 类 型 使 用 new 创 建 对 象 。 

2) 根据 类 型 定义 变量 ， 类 型 可 能 是 基本 类 型 、 类 、 接 口 或 数组 。 
3) 将 特定 类 型 的 对 象 传递 给 方法 。 

4) 根据 类 型 访问 对 象 的 属性 ， 调 用 对 象 的 方法 。 





编译 器 也 是 根据 类 型 进行 代码 的 检查 编译 的 。 


反射 不 一 样 ， 它 是 在 运行 时 ， 而 非 编译 时 ， 动 态 获 取 类 型 的 信息 ， 
比如 接口 信息 、 成 员 信 息 、 方 法 信息 、 构 造 方 法 信息 等 ， 根 据 这 些 动态 
获取 到 的 信息 创建 对 象 、 访 问 /修改 成 员 、 调 用 方法 等 。 这 么 说 比较 抽 
象 ， 下 面 我 们 会 具体 说 明 。 反 射 的 入 口 是 名 称 为 Class 的 类 ， 我 们 先 介绍 
CR 
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21.1 ass 人 关 


在 介绍 类 和 继承 的 实现 原理 时 ， 我 们 提 到 ， 每 个 已 加 载 的 类 在 内 存 
都 有 一 份 类 信息 ， 每 个 对 象 都 有 指向 它 所 属 类 信息 的 引用 。Java 中 ， 关 
信息 对 应 的 类 就 是 java.lang.Class。 注 意 不 是 小 写 的 dass，class 是 定义 类 
A 所 有 类 的 根 父 类 Object 有 一 个 方法 ， 可 以 获取 对 象 的 Class 对 











public final native Class<?> getClass() 





Class 是 一 个 泛 型 类 ， 有 一 个 类 型 参数 ，getClass () 并 不 知道 具体 
的 类 型 ， 所 以 返回 Class<? >。 


获取 Class 对 象 不 一 定 需 要 实例 对 象 ， 如 果 在 写 程序 时 就 知道 类 名 ， 
可 以 使 用 < 类 名 >.class 获 取 Class 对 象 ， 比 如 : 








Class<Date> cls = Date.class; 








接口 也 有 Class 对 象 ， 且 这 种 方式 对 于 接口 也 是 适用 的 ， 比 如 : 





Class<Comparable> cls = Comparable.class,; 








基本 类 型 没有 getClass 方 法 ， 但 也 都 有 对 应 的 Class 对 象 ， 类 型 参数 
为 对 应 的 包装 类 型 ， 比 如 : 





Class<Integer> intCls = int.class; 
Class<Byte> byteCls = byte.class; 
Class<Character> charCls = char.class,; 
Class<Double> doubleCls = double.class; 





void 作 为 特殊 的 返回 类 型 ， 也 有 对 应 的 Class: 





Class<Void> voidCls = void.class; 





对 于 数组 ， 每 种 类 型 都 有 对 应 数组 类 型 的 Class 对 象 ， 每 个 维度 都 有 
一 个 ， 即 一 维 数组 有 一 个 ， 二 维 数组 有 一 个 不 同 的 类 型 。 比 如 : 





String[] strArr = new String[10] 

int[][] twoDimArr = new int[3][2]; 

int[] oneDimArr = new int[10]; 

Class<? extends String[]> strArrCls = strArr.getClass(); 
Class<? extends int[][]> twoDimArrCls = twoDimArr.getClass(); 
Class<? extends int[]> oneDimArrCls = oneDimArr.getClass(); 





枚 举 类 型 也 有 对 应 的 Class， 比 如 : 





enum Size { 
SMALL, MEDIUM, BIG 
} 





Class 有 一 个 静态 方法 forName， 可 以 根据 类 名 直接 加 载 Class， 获 取 
Class 对 象 ， 比 如 : 





try { 
Class<?> cls = Class.forName("java.util.HashMap"); 
System.out.println(cls.getName( )); 

} catch (ClassNotFoundException e) { 
e.printSstackTrace( ); 





注意 forName 可 能 抛 出 异常 ClassNotFoundException 。 


有 了 Class 对 象 后 ， 我 们 就 可 以 了 解 到 关于 类 型 的 很 多 信息 ， 并 基于 
这 些 信 息 采 取 一 些 行动 。Class 的 方法 很 多 ， 大 部 分 比较 简单 直接 ， 容 易 
理解 ， 下 面 ， 我 们 分 为 在 干 组 ， 包 括 名 称 信 息 、 字 段 信 息 、 方 法 信息 、 
创建 对 象 和 构造 方法 、 类 型 信息 等 ， 进 行 简要 介绍 。 


1. 名 称 信息 


Class 有 如 下 方法 ， 可 以 获取 与 名 称 有 关 的 信息 : 














public String getName() 

public String getSimpleName() 
public String getCanonicalName() 
public Package getPackage() 





getSimpleName 返 回 的 名 称 不 带 包 信 息 ，getName 返 回 的 是 Java 内 部 
使 用 的 真正 的 名 称 ， BL non Nm 回 的 名 称 更 为 友好 ， 
getPackage 返 回 的 是 包 信 息 ， 它 们 的 不 同 如 表格 21-1 所 示 。 


表 21-1 不 同 Class 对 象 的 各 种 名 称 方法 的 返回 值 


String.class Java.lang. String Java.lang 
String[].class [Ljava.lang.String: Java.lang.String[] null 
HashMap.class Java.util 


Map.Entry.class Java.util.Map$Entry Java.util.Map.Entry Java.util 








需要 说 明 的 是 数组 类 型 的 getrName 返 回 值 ， 它 使 用 前 缀 [表示 数组 ， 
有 几 个 [表示 是 几 维 数组 ， 数组 的 类 型 用 一 个 字符 表示 ，I 表 示 int，L 表 
示 类 或 接口 ， 其 他 类 型 与 字符 的 对 应 关系 为 : boolean (Z) 、 
byte (B) 、char (C) 、double (D) 、float (F) 、long〈J) 、 
short (S) 。 对 于 引用 类 型 的 数组 ， 注 意 最 后 有 一 个 分 号 ; 。 





2. 宇 段 信 息 


类 中 定义 的 静态 和 实例 变量 部 被 称 为 字段 ， 用 类 Field 表 示 ， 位 于 包 
java.lang.reflect 下 ， 后 文 涉及 的 反射 相关 的 类 都 位 于 该 包 下 。Class 有 4 个 
获取 字段 信息 的 方法 : 









































public Field[] getFields() 

// 返 回 本 类 声明 的 所 有 字段 ， 包 括 非 public 的 ， 但 不 包括 父 
public Field[] getDeclaredFields() 

// 返 回 本 类 或 父 类 中 指定 名 称 的 public 字 段 ， 找 不 到 抛 出 异常 NoSuchFieldException 
public Field getField(String name) 

// 返 回 本 类 中 声明 的 指定 名 称 的 字段 ， 找 不 到 抛 出 异常 NoSuchFieldException 
public Field getDeclaredField(String name) 


// 返 回 所 有 的 public 字 段 ， 包 括 其 父 类 的 ， 如 果 没 有 字段 ， 返 回 空 数组 
类 
































Field 也 有 很 多 方法 ， 可 以 获取 字段 的 信息 ， 也 可 以 通过 Field 访 问 和 
操作 指定 对 象 中 该 字段 的 值 ， 基 本 方法 有 : 





// 获 取 字 段 的 名 称 

public String getName() 

// 判 断 当前 程序 是 否 有 该 字段 的 访问 权限 

public boolean isAccessible() 

//flag 设 为 true 表 示 忽 略 Java 的 访问 检查 机 制 ， 以 允许 读 写 非 public 的 字段 
public void setAccessible(boolean flag) 

// 获 取 指 定 对 象 obj 中 该 字段 的 值 

public Object get(Object obj ) 

// 将 指定 对 象 obj 中 该 字段 的 值 设 为 value 

public void set(Object obj, Object value) 





























在 get/set 方 法 中 ， 对 于 静态 变量 ， obj 补 忽略 ， 可 以 为 null， 如 果 字 
段 值 为 基本 类 型 ，get/set 会 自动 在 基本 类 0 型 间 进 行 转 
换 ; 对 于 private 字 段 ， 直 接 调 用 get/set 会 抛 出 非法 访问 异 
IllegalAccessException， 应 该 先 调用 setAccessible (true) 以 关闭 Java 的 
检查 机 制 。 看 段 简单 的 示例 代码 : 








List<String> obj = Arrays.asList(new String[]{" 老 马 ", "编程 "})，; 
Class<?> cls = obj.getcClass(); 
for(Field f : cls.getDeclaredFields())t{ 
f.setAccessible(true); 
System.out.printin(f.getName()+" - "+f.get(obj)); 





Da 就 不 歼 述 了 。 除 了 以 上 方法 ，Field 还 有 很 多 其 他 方 
, 》 比 0: 





// 返 回 字段 的 修饰 符 

public int getModifiers() 

// 返 回 字 段 的 类 型 

public Class<?> getType() 

// 以 基本 类 型 操作 字段 

public void setBoolean(Object obj, boolean z) 
public boolean getBoolean(Object obj) 

public void setDouble(Object obj, double d) 
public double getDouble(Object obj) 

// 查 询 字 段 的 注解 信息 ， 下 一 章 介 绍 注解 

public <T extends Annotation> T getAnnotation(Class<T> annotationClass) 
public Annotation[] getDeclaredAnnotations() 






































getModifiers 返 回 的 是 一 个 int， 可 以 通过 Modifier 类 的 静态 方法 进行 
解读 。 比 如 ， 假 定 Student 类 有 如 下 字段 : 





public static final int MAX_NAME_LEN = 255 





可 以 这 样 查看 该 字段 的 修饰 符 : 





Field f = Student.class.getField("MAX NAME LEN"); 
int mod = f.getModifiers(); 
System.out.println(Modifier.toString(mod)); 


System.out.println("ispPublic: " + Modifier.isPublic(mod)); 
System.out.println("isStatic: " + Modifier.isStatic(mod)); 
System.out.println("isFinal: " + Modifier.isFinal(mod)); 
System.out.println("isVolatile: " + Modifier.isVolatile(mod)); 





输出 为 : 





public static final 
isPublic: true 
isStatic: true 
isFinal: true 
isVolatile: false 





3 方法 信息 4D 


类 中 定义 的 静态 和 实例 方法 都 被 称 为 方法 ， 用 类 Method 表 示 。 
Class 有 如 下 相关 方法 : 









































public Method[] getMethods() 

// 返 回 本 类 声明 的 所 有 方法 ， 包 括 非 pub1ic 的 ， 但 不 包括 父 
public Method[] getDeclaredMethods() 

// 返 回 本 类 或 父 类 中 指定 名 称 和 参数 类 型 的 public 方 法 ， 
// 找 不 到 抛 出 异常 NoSuchMethodException 

public Method getMethod(String name，CJass<?>,,，parameterTypes ) 

// 返 回 本 类 中 声明 的 指定 名 称 和 参数 类 型 的 方法 ， 找 不 到 抛 出 异常 YoSuchMethodException 
public Method getDeclaredMethod(String name, Class<?>... parameterTypes) 


// 返 回 所 有 的 public 方 法 ， 包 括 其 父 类 的 ， 如 果 没 有 方法 ， 返 回 空 数组 
类 












































通过 Method 可 以 获取 方法 的 信息 ， 也 可 以 通过 Method 调 用 对 象 的 
方法 ， 基 本 方法 有 : 





// 获 取 方 法 的 名 称 

public String getName() 

//flag 设 为 true 表 示 忽 略 Java 的 访问 检查 机 制 ， 以 允许 调用 非 public 的 方法 

public void setAccessible(boolean flag) 

// 在 指定 对 象 obj 上 调用 Method 代 表 的 方法 ， 传 递 的 参数 列表 为 args 

public Object invoke(Object obj, Object... args) throws 
IllegalAccessException, Illegal-ArgumentException, InvocationTargetException 

















上 





























对 invoke 方 法 ， 如 果 Method 为 静态 方法 ，obj 被 忽略 ， 可 以 为 null， 
args 可 以 为 null， 也 可 以 为 一 个 空 的 数组 ， 方 法 调用 的 返回 值 被 包装 为 
Object 返 回 ， 如 果实 际 方法 调用 抛 出 异常 ， 异 常 被 包装 为 
InvocationTargetException 重 新 抛 出 ， 可 以 通过 getCause 方 法 得 到 原 异 
党 。 看 段 简 单 的 示例 : 








Class<?> cls = Integer.class; 
try { 
Method method = cls.getMethod("parseInt", new Class[]{String.class}); 
System.out.printlin(method.invoke(null, "123")); 
} catch (NoSuchMethodException e) { 
e.printSstackTrace( ); 
} catch (InvocationTargetException e) { 
e.printSstackTrace( ); 
} 





Method 还 有 很 多 方法 ， 可 以 获取 其 修饰 符 、 参 数 、 返 回 值 、 注 解 等 
言 思 ， 有 具体 就 不 列举 了 。 


4. 创 建 对 象 和 构造 方法 
Class 有 一 个 方法 ， 可 以 用 它 来 创建 对 象 : 





public T newInstance() throws InstantiationException, IllegalAccessException 





它 会 调用 类 的 默认 构造 方法 〔( 即 无 参 public 构 造 方法 ) ， 如 果 类 没 
有 该 构造 方法 ， 会 抛 出 异常 InstantiationException。 看 个 简单 示例 : 





Map<String,Integer> map = HashMap.class.newInstance(); 
map.put("hello", 123); 





newInstance 只 能 使 用 默认 构造 方法 。Class 还 有 一 些 方法 ， 可 以 获取 
所 有 的 构造 方法 : 

















// 获 取 所 有 的 pub1ic 构 造 方法 ， 返 回 值 可 能 为 长 度 为 9 的 空 数 组 

public Constructor<?>[] getConstructors() 

// 获 取 所 有 的 构造 方法 ， 包 括 非 public 的 

public Constructor<?>[] getDeclaredConstructors() 

// 获 取 指 定 参 数 类 型 的 public 构 造 方法 ， 没 找到 抛 出 异常 NoSuchMethodException 

public Constructor<T> getConstructor(Class<?>... parameterTypes ) 

// 获 取 指 定 参 数 类 型 的 构造 方法 ， 包 括 非 public 的 ， 没 找到 抛 出 异常 NoSuchMethodException 






























































public Constructor<T> getDeclaredConstructor(Class<?>... parameterTypes ) 





类 Constructor 表 示 构 造 方法 ， 通 过 它 可 以 创建 对 象 ， 方 法 为 : 





public T newInstance(Object ... initargs) throws InstantiationException, 
IllegalAccessException, IllegalArgumentException, InvocationTargetException 





看 个 例子 : 





Constructor<StringBuilder> contructor= StringBuilder.class 
.getConstructor(new Class[]{int.class}); 
StringBuilder sb = contructor.newInstance(100); 





除了 创建 对 象 ，Constructor 还 有 很 多 方法 ， 可 以 获取 关于 构造 方法 
的 很 多 信息 ， 包 括 参数 、 修 饰 符 、 注 解 等 ， 具 体 就 不 列举 了 。 


5. 类 型 检查 和 转换 
我 们 之 前 介绍 过 instanceof 关 键 字 ， 它 可 以 用 来 判断 变量 指向 的 实际 


对 象 类 型 。 instanceof 后 面 的 类 型 是 在 代码 中 确定 的 如 果 要 检查 的 类 型 
是 动态 的 ， 可 以 使 用 Class 类 的 如 下 方法 : 











public native boolean isInstance(Object obj ) 





也 就 是 说 ， 如 下 代码 : 





if(list instanceof ArrayList){ 
System.out.printilin("array list"); 





和 下 面 代码 的 输出 是 相同 的 : 





Class cls = Class.forName("java.util.ArrayList"); 

if(cls.isInstance(list)){ 
System.out.println("array list"); 

} 





除了 判断 类 型 ， 在 程序 中 也 往往 需要 进行 强制 类 型 转换 ， 比 如 : 





List list = .. 
if(list instanceof ArrayList){ 
ArrayList arrList = (ArrayList)list,; 





在 这 段 代 码 中 ， 强 制 转换 到 的 类 型 是 在 写 代 码 时 就 知道 的 。 如 果 是 
动态 的 ， 可 以 使 用 Class 的 如 下 方法 : 





public T cast(Object obj) 





比如 : 





public static <T> T toType(Object obj, Class<T> cls)t{ 
return cls.cast(obj); 
} 





isInstance/cast 描 述 的 都 是 对 象 和 类 之 间 的 关系 ，Class 还 有 一 个 方 
法 ， 可 以 判断 Class 之 间 的 关系 : 








// 检 查 参 数 类 型 c1s 能 否 赋 给 当前 Class 类 型 的 变量 
public native boolean isAssignableFrom(Class<?> cls); 














比如 ， 如 下 表达 式 的 结果 都 为 true: 





Object.class.isAssignableFrom(String.class) 
String.class.isAssignableFrom(String.class) 
List.class.isAssignableFrom(ArrayList.class) 





6.Class 的 类 型 信息 


Class 代 表 的 类 型 既 可 以 是 普通 的 类 ， 也 可 以 是 内 部 类 ， 还 可 以 是 基 
本 类 型 、 数 组 等 ， 对 于 一 个 给 定 的 Class 对 象 它 到 底 是 什么 类 型 呢 ? 可 
以 通过 以 下 方法 进行 检查 : 





public native boolean isArray() // 是 否 是 数组 

public native boolean isPrimitive()  // 是 否 是 基本 类 型 
public native boolean isInterface() // 是 否 是 接口 
public boolean isEnum() // 是 否 是 枚 举 
public boolean isAnnotation() // 是 否 是 注解 

public boolean isAnonymousClass() // 是 否 是 匿名 内 部 类 

public boolean isMemberClass() // 是 否 是 成 员 类 ， 成 员 类 定义 在 方法 外 ， 不 是 匿名 类 
public boolean isLocalclass() // 是 否 是 本 地 类 ， 本 地 类 定义 在 方法 内 ， 不 是 匿名 类 





















































7. 类 的 声明 信息 


Class 还 有 很 多 方法 ， 可 以 获取 类 的 声明 信息 ， 如 修饰 符 、 父 类 、 接 
口 、 注 解 等 ， 如 下 所 示 : 

















// 获 取 修 饰 符 ， 返 回 值 可 通过 Modifier 类 进行 解读 
public native int getModifiers() 
// 获 取 父 类 ， 如 果 为 0bject， 父 类 为 null 
public native Class<? Super T> getSuperclass() 
// 对 于 类 ， 为 自己 声明 实现 的 所 有 接口 ， 对 于 接口 ， 为 直接 扩展 的 接口 ， 不 包括 通过 父 类 继承 的 
public native Class<?>[] getIinterfaces(); 
// 自 己 声明 的 注解 
public Annotation[] getDeclaredAnnotations() 
// 所 有 的 注解 ， 包 括 继承 得 到 的 
public Annotation[] getAnnotations( ) 
// 获 取 或 检查 指定 类 型 的 注解 ， 包 括 继承 得 到 的 
public <A extends Annotation> A getAnnotation(Class<A> annotationClass) 
public boolean isAnnotationpresent( 
Class<? extends Annotation> annotationClass) 








































































































8. 类 的 加 载 
Class 有 两 个 静态 方法 ， 可 以 根据 类 名 加 载 类 : 





public static Class<?> forName(String className) 
public static Class<?> forName(String name, boolean initialize, 
ClassLoader loader) 





ClassLoader 表 示 类 加 载 器 ， 第 24 章 会 进一步 介绍 ，initialize 表 示 加 
载 后 ， 是 否 执行 类 的 初始 化 代码 〈 如 static 语 句 块 ) 。 第 一 个 方法 中 没有 
传 这 些 参数 ， 相 当 于 调用 : 





Class.forName(className, true, currentLoader) 





currentLoader 表 示 加 载 当前 类 的 ClassLoader。 


这 里 className 与 Class.getName 的 返回 值 是 一 致 的 。 比 如 ， 对 于 
String 数 组 : 





String name = "[Ljava.lang.String;"; 
Class cls = Class.forName(name); 
System,out.println(cls == String[].class); 





需要 注意 的 是 ， 基 本 类 型 不 支持 forName 方 法 ， 也 就 是 说 ， 如 下 写 





Class.forName("int"); 





会 抛 出 异常 ClassNotFoundException。 那 如 何 根据 原始 类 型 的 字符 
串 构 造 Class 对 象 呢 ? 可 以 对 Class.forName 进 行 一 下 包装 ， 比 如 : 





public static Class<?> forName(String className) 
throws ClassNotFoundException{ 
if("int".equals(className))t{ 
return int.class; 











} 
// 其 他 基本 类 型 略 


return Class.forName(className); 





} 





需要 说 明 的 是 ，Java 9 还 有 一 个 forName 方 法 ， 用 于 加 载 指 定 模块 中 
指定 名 称 的 类 : 





public static Class<?> forName(Module module, String name ) 





参数 module 表 示 模 块 ， 这 是 Java 9 引入 的 类 ， 当 找 不 到 类 的 时 候 ， 
它 不 会 抛 出 异常 ， 而 是 返回 null， 它 也 不 会 执行 类 的 初始 化 。 


9. 反 射 与 数组 
对 于 数组 类 型 ， 有 一 个 专门 的 方法 ， 可 以 获取 它 的 元 素 类 型 : 





public native Class<?> getComponentType() 





比如 : 





String[] arr = new String[]{}; 
System,out.println(arr.getClass().getComponentType() )， 





输出 为 : 





class java.lang.String 





java.lang.reflect 包 中 有 一 个 针对 数组 的 专门 的 类 Array 注意 不 是 
javautil 中 的 Arrays) ， 提 供 了 对 于 数组 的 一 些 反 射 文 持 ， 以 便于 统一 处 
理 多 种 类 型 的 数组 ， 主 要 方法 有 : 





// 创 建 指定 元 素 类 型 、 指 定 长 度 的 数组 

public static Object newInstance(Class<?> componentType, int length) 

// 创 建 多 维 数组 

public static Object newInstance(Class<?> componentType, int... dimensions) 
// 获 取 数 组 array 指 定 的 索引 位 置 ndex 处 的 值 

public static native Object get(Object array, int index) 

// 修 改 数 组 array 指 定 的 索引 位 置 ndex 处 的 值 为 value 

public static native void set(Object array, int index, Object value) 
// 返 回 数组 的 长 度 

public static native int getLength(Object array) 







































































需要 注意 的 是 ， 在 Array 类 中 ， 数 组 是 用 Object 而 非 ObjectD] 表 示 
的 ， 这 是 为 什么 呢 ? 这 是 为 了 方便 处 理 多 种 类 型 的 数组 。int[]、String[] 
都 不 能 与 Object[] 相 互 转换 ， 但 可 以 与 Object 相互 转换 ， 比 如 : 





int[] intArr = (int[])Array.newInstance(int.class, 10); 
String[] strArr = (String[])Array.newInstance(String.class, 10); 





除了 以 Object 类 型 操作 数组 元 素 外 ，Array 也 文 持 以 各 种 基本 类 型 操 
作 数 组 元 素 ， 如 : 





public static native double getDouble(Object array, int index ) 

public static native void setDouble(Object array, int index, double d) 
public static native void setLong(Object array, int index, long 1) 
public static native long getLong(Object array, int index) 





10. 反 射 与 枚 举 
枚 举 类 型 也 有 一 个 专门 方法 ， 可 以 获取 所 有 的 枚 举 常量 : 


public T[] getEnumConstants() 


21.2 ”应 用 示例 


介绍 了 Class 的 这 么 多 方法 ， 有 什么 用 呢 ? 我 们 看 个 简单 的 示例 ， 利 
用 反射 实现 一 个 简单 的 通用 序列 化 / 反 序 列 化 类 SimpleMapper， 它 提供 
两 个 静态 方法 : 





public static String toString(Object obj) 
public static Object fromString(String str) 





toString 将 对 象 obj 转 换 为 字符 串 ，fromString 将 字符 串 转 换 为 对 象 。 
为 简 蛙 起见， 我 们 只 支持 最 简单 的 类 ， 即 有 默认 构造 方法 ， 成 员 类 型 只 
有 基本 类 型 、 包 装 类 或 String。 男 外 ， 序 列 化 的 格式 也 很 简单 ， 第 一 行 
为 类 的 名 称 ， 后 面 每 行 表示 一 个 字段 ， 用 字符 = 分 隔 ， 表 示 字 段 名 称 和 
字符 串 形 式 的 值 。 我 们 先 看 SimpleMapper 的 用 法 ， 如 代码 清单 21-1 所 
钞 。 


代码 清单 21-1 简单 的 通用 序列 化 / 反 序 列 化 类 SimpleMapper 的 使 用 





public class SimpleMapperDemo { 
static class Student { 
String name 
Int age; 
Double Score 
// 省 略 了 构造 方法 ，getter/setter 和 和 toString 方法 











} 
public static void main(String[] args) { 
Student zhangsan = new Student(" 张 三 ", 18, 89d); 
String str = SimpleMapper.toString(zhangsan); 
Student zhangsan2 = (Student) SimpleMapper.fromString(str); 
System.out.printlin(zhangsan2); 
} 


} 





代码 先 调用 toString 方 法 将 对 象 转换 为 了 String， 然 后 调用 fromString 
I 转换 为 了 Student， 新 对 象 的 值 与 原 对 象 是 一 样 的 ， 输 出 如 
下 所 示 : 





Student [name= 张 三 ，age=18， score=89.,0] 











我 们 来 看 SimpleMapper 的 示例 实现 〈 主 要 用 于 演示 原理 ) ，toString 
的 代码 为 : 





public static String toString(Object obj) { 
try { 

Class<?> cls = 0bj,getClass()， 

StringBuilder sb = new StringBuilder(); 

sb.append(cls.getName() + "\n"); 

for(Field f : cls.getDeclaredFields()) { 

if(!f.isAccessible()) { 

f,setAccessible(true); 


} 
sb.append(f.getName() + "=" + f.get(obj).toSstring() + "\n"); 


return Sb,toString()， 
} catch(IllegalAccessException e) { 
throw new RuntimeException(e); 


} 





代码 比较 人 简单， 我 们 就 不 袭 述 了 。fromString 的 代码 为 : 





public static Object fromString(String str) { 
try { 
String[] lines = str.split("\n"); 
if(lines.length < 1) { 
throw new IllegalArgumentException(str); 
} 
Class<?> cls = Class.forName(lines[0]); 
Object obj = cls.newInstance( ); 
if(lines.length > 1) { 
for(int i = 1; i < lines.length; I++) { 
String[] fv = lines[i].split("="); 
if(fv.length != 2) { 
throw new IllegalArgumentException(lines[i]); 


Field f = cls.getDeclaredField(fv[0]); 
if(!f.isAccessible()){ 
f.setAccessible(true); 


} 
setFieldvValue(f, obj, fv[1]); 
} 
J 
return obj; 


} catch(Exception e) { 
throw new RuntimeException(e); 


} 





它 调 用 了 setFieldValue 方 法 对 字段 设置 值 ， 其 代码 为 : 





private static void setFieldValue(Field f, Object obj，String value) 
throws Exception { 
Class<?> type = f.getType(); 
if(type == int.class) { 
f.,setInt(obj, Integer.parseInt(value)); 
} else if(type == byte.class) { 
f.,setByte(obj, Byte.parseByte(value)); 
} else if(type == short.class) { 
f,setShort(obj, Short.parseShort(value)); 
} else if(type == long.class) { 
f,setLong(obj, Long.parseLong(value)); 
} else if(type == float.class) { 
f,setFloat(obj, Float.parseFloat(value)); 
} else if(type == double.class) { 
f,setDouble(obj, Double.parseDouble(value)); 
} else if(type == char.class) { 
f.,setchar(obj, value.charAt(0)); 
} else if(type == boolean.class) { 
f,setBoolean(obj, Boolean.parseBoolean(value)); 
} else if(type == String.class) { 
f,set(obj, value); 
} else { 
Constructor<?> ctor = type.getConstructor( 
new Class[] { String.class }); 
f,set(obj, ctor.newInstance(value)); 





setFieldValue 根 据 字 段 的 类 型 ， 将 字符 串 形 式 的 值 转换 为 了 对 应 类 





型 的 值 ， 对 于 基本 类 型 和 String 以 外 的 类 型 ， 它 假定 该 类 型 有 一 个 以 


String 类 型 为 参数 的 构造 方法 。 


示例 的 完整 代码 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c84 下。 
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在 介绍 泛 型 的 时 候 ， 我 们 提 到 ， 泛 型 参数 在 运行 时 会 被 的 除 ， 这 
里 ， 我 们 需要 补充 一 下 ， 在 类 信息 Class 中 依然 有 关于 泛 型 的 一 些 信 息 ， 
可 以 通过 反射 得 到 。 泛 型 涉及 一 些 更 多 的 方法 和 类 ， 上 面 的 介绍 中 进行 
了 忽略 ， 这 里 简要 补充 下 。 


Class 有 如 下 方法 ， 可 以 获取 类 的 泛 型 参数 信息 : 














public TypeVariable<Class<T>>[] getTypeParameters( ) 





Field 有 如 下 方法 : 





public Type getGenericType() 





Method 有 如 下 方法 : 





public Type getGenericReturnType() 
public Type[] getGenericParameterTypes() 
public Type[] getGenericExceptionTypes() 





Constructor 有 如 下 方法 : 





public Type[] getGenericParameterTypes() 





Type 是 一 个 接口 ，Class 实 现 了 Type，Type 的 其 他 子 接口 还 有 : 
“TypeVariable: 类 型 参数 ， 可 以 有 上 界 ， 比 如 Textends Number; 


ParameterizedType: 参数 化 的 类 型 ， 有 原始 类 型 和 具体 的 类 型 参 
数 ， 比 如 List; 


"WildcardType: 通配符 类 型 ， 比 如 ? 、? extends Number、? super 
Integer。 


我 们 看 一 个 简单 的 示例 ， 如 代码 清单 21-2 所 示 。 
代码 清单 21-2 ”通过 反射 获取 泛 型 信息 示例 





public class GenericDemo { 
static class GenericTest<U extends Comparable<U>, V> { 
U u; 
Vv; 
List<String> list,; 
public U test(List<? extends Number> numbers) { 
return null,; 
} 


public static void main(String[] args) throws Exception { 
Class<?> cls = GenericTest.class; 
// 类 的 类 型 参数 
for(TypeVariable t : cls.getTypeParameters()) { 
System,out.println(t,getName() + " extends " + 
Arrays.toSstring(t.getBounds())); 





} 
// 字 段 : 泛 型 类 型 
Field fu = cls.getDeclaredField("u"); 
System.out.printlin(fu.getGenericType( )); 
// 字 段 : 参数 化 的 类 型 
Field flist = cls.getDeclaredField("1list"); 
Type listType = flist.getGenericType(); 
if(listType instanceof ParameterizedType) { 
ParameterizedType pType = (ParameterizedType) listType; 
System,.out.printJln("raw type: " + pType.getRawType() 
+ ",type arguments:" 
+ Arrays.toString(pType.getActualTypeArguments())); 
+ 
// 方 法 的 泛 型 参数 
Method m = cls.getMethod("test", new Class[] { List,class }); 
for(Type t : m.getGenericPparameterTypes()) { 
System.out.printin(t); 
} 








程序 的 输出 为 : 





U extends [java.lang.Comparable<U>] 

V extends [class java.lang.0Object] 

U 

raw type: interface java.util.List,type arguments:[class java.lang.SsString] 
java.util.List<? extends java.lang.Number> 





代码 比较 简单 ， 我 们 就 不 痪 述 了 。 


本 章 介 绍 了 Java 中 反射 相关 的 主要 类 和 方法 ， 通 过 入 口 类 Class， 可 





以 访问 类 的 各 种 信息 ， 如 字段 、 方 法 、 构 造 方法 、 父 类 、 接 口 、 泛 型 信 
上 县 等 ， 也 可 以 创建 和 操作 对 象 、 调 用 方法 等 ， 利 用 这 些 方 法 ， 可 以 编写 
通用 的 、 动 态 灵活 的 程序 ， 本 重演 示 了 一 个 简单 的 通用 序列 化 / 反 序 列 
化 类 SimpleMapper。 


反射 虽然 是 灵活 的 ， 但 一 般 情 况 下 ， 并 不 是 我 们 优先 建议 的 ， 主 要 
原因 是 : 

1) 反射 更 容易 出 现 运 行 时 错误 ， 使 用 显 式 的 类 和 接口 ， 编 译 占 能 
帮 我 们 做 类 型 检查 ， 减 少 错误 ， 但 使 用 反射 ， 类 型 是 运行 时 才 知 道 的 ， 
编译 器 无 能 为 力 。 

2) 反射 的 性 能 要 低 一 些 ， 在 访问 字段 、 调 用 方法 前 ， 反 射 先 要 得 
找 对 应 的 Field/Method， 要 慢 一 些 。 

简单 地 说 ， 如 果 能 用 接口 实现 同样 的 灵活 性 ， 束 不 要 使 用 反射 。 


本 章 介 绍 的 很 多 类 (如 Class、Field、Method、Constructor〉 都 可 以 
有 注解 ， 注 解 到 底 是 什么 呢 ? 让 我 们 下 章 探 讨 。 








第 22 章 ”注解 


前 一 章 我 们 探讨 了 反射 ， 反 射 相 关 的 类 中 都 有 方法 获取 注解 信息 ， 
我 们 在 前 面 章 节 中 也 多 次 提 到 过 注解 ， 注 解 到 底 是 什么 昵 ? 在 Java 中 ， 
注解 就 是 给 程序 添加 一 些 信 息 ， 用 字符 @ 开 头 ， 这 些 信 息 用 于 修饰 它 后 
面 紧 挨 着 的 其 他 代码 元 素 ， 比 如 类 、 接 口 、 字 段 、 方 法 、 方 法 中 的 参 
数 、 构 造 方法 等 。 注 解 可 以 被 编译 器 、 程 序 运行 时 和 其 他 工具 使 用 ， 用 
于 增强 或 修改 程序 行为 等 。 


这 么 说 比较 抽象 ， 下 面 我 们 会 具体 介绍 。 先 介绍 Java 的 一 些 内 置 注 
解 ， 然 后 介绍 一 些 框架 和 库 的 注解 ， 了 和 解 了 注解 的 使 用 之 后 ， 介绍 怎么 
创建 注解 ， 如 何 利 用 反射 查看 注解 信息 ， 最 后 我 们 介绍 注解 的 两 个 应 
用 : 定制 序列 化 和 依赖 注入 容器 。 














22.1 内 症 注 解 

Java 内 置 了 一 些 常用 注解 : @Override、@Deprecated、 
@SuppressWarnings， 我 们 简要 介绍 。 
1.@Override 


@Override 修 饰 一 个 方法 ， 表示 该 方法 不 是 当前 类 首先 声明 的 ， 而 
是 在 某 个 父 类 或 实现 的 接口 中 声明 的 ， 当 前 类 “ 重 写 ”了 该 方法 ， 比 如 : 








static class Base { 
public void action() {}; 


static class Child extends Base { 
Q@Override 
public void action(){ 
System.out.printin("child action"); 
} 


Q@Override 


public String toString() { 
return "child",; 
} 


} 





Child 的 action 方 法 重 写 了 父 类 Base 中 的 action 方 法 ，toString 方 法 重 
写 了 Object 类 中 的 toString 方 法 。 这 个 注解 不 写 也 不 会 改变 这 些 方法 
是 “ 重 写 ?的 本 质 ， 那 有 什么 用 呢 ? 它 可 以 减少 一 些 编程 错误 。 如 果 方 法 
有 Override 注 解 ， 但 没有 任何 父 类 或 实现 的 接口 声明 该 方法 ， 则 编译 器 
会 报错 ， 强 制程 序 员 修 复 该 问题 。 比 如 ， 在 上 面 的 例子 中 ， 如 果 程 序 员 
修改 了 Base 方 法 中 的 action 方 法 定义 ， 变 为 了 : 











static class Base 
public void doAction() {}; 
} 








但 是 ， 程 序 员 访 记 了 修改 Child 方 法 ， 如 果 没 有 Override 注 解 ， 编 译 
右 不 会 报告 任何 错误 ， 它 会 认为 action 方 法 是 Child 新 加 的 方法 ， 
doAction 会 调用 父 类 的 方法 ， 这 与 程序 员 的 期 望 是 不 符 的 ， 而 有 了 
Override 注 解 ， 编 译 器 就 会 报告 错误 。 所 以 ， 如 果 方 法 是 在 父 类 或 接口 


中 定义 的 ， 加 上 @oOverride 吧 ， 让 编译 器 帮 你 减少 错误 。 
2.@Deprecated 


@Deprecated 可 以 修饰 的 范围 很 广 ， 包 括 类 、 方 法 、 字 段 、 参 数 
等 ， 它 表示 对 应 的 代码 已 经 过 时 了 ， 程 序 员 不 应 该 使 用 它 ， 不 过 ， 它 是 
一 种 警告 ， 而 不 是 强制 性 的 ， 在 IDE 如 Eclipse 中 ， 会 给 Deprecated 元 素 加 
一 条 删除 线 以 示警 告 。 比 如 ，Date 中 很 多 方法 就 过 时 了 : 











@Deprecated 

public Date(int year, int month, int date) 
@Deprecated 

public int getYear() 





在 声明 元 素 为 @Deprecated 时 ， 应 该 用 Java 文 档 注释 的 方式 同时 说 
明 蔡 代 方 案 ， 就 像 Date 中 的 API 文 档 那 样 ， 在 调用 @Deprecated 方 法 时 ， 
应 该 先 考 虑 其 建议 的 替代 方案 。 


从 Java 9 开始 ，@Deprecated 多 了 两 个 属性 : since 和 forRemoval。 
since 是 一 个 字符 串 ， 表 示 是 从 哪个 版 本 开始 过 时 的 ; forRemoval 是 一 个 
boolean 值 ， 表 示 将 来 是 否 会 删除 。 比 如 ，Java 9 中 Integer 的 一 个 构造 方 
法 束 从 版 本 9 开始 过 时 了 ， 其 代码 为 : 








@Deprecated(since="9") 
public Integer(int value) { 
this.value = value; 

} 





3.@Suppress Warnings 


@SuppressWarnings 表 示 压 制 Java 的 编译 警告 ， 它 有 一 个 必 填 参数 ， 
表示 压制 哪 种 类 型 的 警告 ， 它 也 可 以 修饰 大 部 分 代码 元 素 ， 在 更 大 范围 
的 修饰 也 会 对 内 部 元 素 起 效 ， 比 如 ， 在 类 上 的 注解 会 影响 到 方法 ， 在 方 
法 十 的 注解 会 影响 到 代码 行 。 对 于 Date 方 法 的 调用 ， 可 以 这 样 压制 警 
口 。 








@Suppresswarnings({"deprecation", "unused"}) 
public static void main(String[] args) { 
Date date = new Date(2017, 4, 12); 


int year = date.getYear(); 


Java 提 供 的 内 置 注解 比较 少 ， 我 们 日 营 开 发 中 使 用 的 注解 基本 都 是 
目 定义 的 。 不 过 ， 一 般 也 不 是 我 们 定义 的 ， 而 是 由 各 种 框架 和 库 定义 
的 ， 我 们 主要 还 是 根据 它们 的 文档 直接 使 用 。 


22.2 ”框架 和 库 的 注解 


各 种 框架 和 库 定义 了 大 量 的 注解 ， 程 序 员 使 用 这 些 注解 配置 框架 和 
库 ， 与 它们 进行 交互 ， 我 们 先 来 看 一 些 例子 ， 包 括 Jackson、 依 赖 注入 容 
器 、Servlet 3.0、Web 应 用 框架 等 ， 最 后 我 们 总 结 下 使 用 注解 的 思维 逻 
办 


1.Jackson 


Jackson 是 一 个 通用 的 序列 化 库 ， 程 序 员 可 以 使 用 它 提供 的 注解 对 序 
列 化 进行 定制 ， 比 如 : 


-使 用 @JsonIgnore 和 @JsonIgnoreProperties 配 置 忽略 字段 。 


.使 用 @JsonManagedReference 和 人 @JsonBackReference 配 置 互相 引用 


人 No 


.使 用 @JsonProperty 和 人 @JsonFormat 配 置 字段 的 名 称 和 格式 等 。 


在 Java 提 供 注 解 功能 之 前 ， 同 样 的 配置 功能 也 是 可 以 实现 的 ， 一 般 
通过 配置 文件 实现 ， 但 是 配置 项 和 要 配置 的 程序 元 素 不 在 一 个 地 方 ， 难 
以 管理 和 维护 ， 使 用 注解 惑 简单 多 了 ， 代 码 和 配置 放 在 一 起 ， 一 目 了 
然 ， 易 于 理解 和 维护 。 


2. 依 赖 注 入 容 需 


现代 Java 开 发 经 党 利用 茶 种 框架 管理 对 象 的 生命 周期 及 其 依赖 关 
系 ， 这 个 框架 一 般 称 为 DI (Dependency Injection)〉 容器 。DI 是 指 依赖 注 
入 ， 流 行 的 框架 有 Spring、Guice 等 。 在 使 用 这 些 框架 时 ， 程 序 员 一 般 不 
通过 new 创 建 对 象 ， 而 是 由 容器 管理 对 象 的 创建 ， 对 于 依赖 的 服务 ， 也 
不 需要 自己 管理 ， 而 是 使 用 注解 表达 依赖 关系 。 这 么 做 的 好 处 有 很 多 ， 
代码 更 为 简单 ， 也 更 为 灵活 ， 比 如 容器 可 以 根据 配置 返回 一 个 动态 代 
理 ， 实 现 AOP， 这 部 分 我 们 在 下 一 章 再 介绍 。 


看 个 简单 的 例子 ，Guice 定 义 了 Inject 注 解 ， 可 以 使 用 它 表 达 依 赖 关 
系 ， 比 如 像 下 面 这 样 : 





有 


public class OrderService { 
@Inject 





UserService userService; 
@Inject 
ProductService productService,; 
A 
} 
3.Servlet 3.0 


Servlet 是 Java 为 Web 应 用 提供 的 技术 框架 ， 早 期 的 Servlet 只 能 在 
web.xml 中 进行 配置 ， 而 Servlet 3.0 则 开始 支持 注解 ， 可 以 使 用 
@WebServlet 配 置 一 个 类 为 Servlet， 比 如 : 





@WebServlet(urlpPatterns = "/async"，asyncSupported = true) 
public class AsyncDemoServilet extends HttpServJlet {..} 





4.Web 应 用 框架 


在 Web 开 发 中 ， 典 型 的 架构 都 是 MVC 〈Model-View-Controller ) ， 
典型 的 需求 是 配置 哪个 方法 处 理 哪 个 URL 的 什么 HTTP 方 法 ， 然 后 将 
HTTP 请 求 参数 映射 为 Java 方 法 的 参数 。 各 种 框架 如 Spring MVC、Jersey 
等 都 支持 使 用 注解 进行 配置 ， 比 如 ， 使 用 Jersey 的 一 个 配置 示例 为 : 





@Path("/hello") 
public class HelloResource { 
@GET 
@Path("test") 
@Produces(MediaType.APPLICATION_JSON) 
public Map<String, Object> test( 
Q@QueryParam("a") String a) { 
Map<String, Object> map = new HashMap<>(); 
map.put("status", "ok"); 
return map; 
} 
} 





类 HelloResource 将 处 理 Jersey 配 置 的 根 路 径 下 /hello 下 的 所 有 请 求 ， 
而 test 方 法 将 处 理 /hello/test 的 GET 请 求 ， 啊 应 格式 为 JSJON， 目 动 映射 
HTTP 请 求 参数 a 到 方法 参数 String a。 


5. 神 奇 的 注解 


通过 以 上 的 例子 ， 我 们 可 以 看 出 ， 注 解 似乎 有 某 种 神奇 的 力量 ， 通 
过 简单 的 声明 ， 束 可 以 达到 某 种 效果 。 在 某 些 方面 ， 它 类 似 于 我 们 之 前 
介绍 的 序列 化 ， 序 列 化 机 制 中 通过 简单 的 Serializable 接 口 ，Java 就 能 自 
动 处 理 很 多 复杂 的 事情 。 它 也 类 似 于 我 们 在 并 发 部 分 中 介绍 的 
synchronized 关 键 字 ， 通 过 它 可 以 目 动 实现 同步 访问 。 


这 些 都 是 声明 式 编程 风格 ， 在 这 种 风格 中 ， 程 序 都 由 三 个 组 件 组 








声明 的 关键 字 和 语法 本 刁 。 
系统 /框架 / 库 ， 它 们 负责 解释 、 执 行 声明 式 的 语句 。 
应 用 程序 ， 使 用 声明 式 风 格 写 程序 。 


在 编程 的 世界 里 ， 访 问 数据 库 的 SQL 语言 、 编 写 网 页 样式 的 CSS， 
以 及 后 续 章 节 将 要 介绍 的 正则 表达 式 、 函 数 式 编程 都 是 这 种 风格 ， 这 种 
风格 降低 了 编程 的 难度 ， 为 应 用 程序 员 提供 了 更 为 高 级 的 语言 ， 使 得 程 
序 员 可 以 在 更 高 的 抽象 层次 上 思考 和 解决 问题 ， 而 不 是 陷于 底层 的 细节 


实现 。 








22.3 创建 注解 


框 锅 和 库 是 怎么 实现 注解 的 呢 ? 我 们 来 看 注解 的 创建 。 
我 们 通过 一 些 例子 来 说 明 ， 先 看 @Override 的 定义 : 





@Target (ElementType .METHOD) 
@Retention(RetentionpPolicy .SOURCE) 
public @interface Override { 


} 








定义 注解 与 定义 接口 有 点 类 似 ， 都 用 了 interface， 不 过 注解 的 
interface 前 多 了 @。 男 外 ， 它 还 有 两 个 元 注解 @Target 和 @Retention， 这 
两 个 注解 专门 用 于 定义 注解 本 身 。@Target 表 示 注 解 的 目标 ，@Override 
的 目标 是 方法 (ElementType.METHOD) 。ElementType 是 一 个 枚 举 ， 
主要 可 选 值 有 : 

.TYPE: 表示 类 、 接 口 (包括 注解 )， 或 者 枚 举 声明 ; 

:FIELD: 字段 ， 包 括 枚 举 常量 ; 

.METHOD: 方法 ; 

.PARAMETER: 方法 中 的 参数 ; 

.CONSTRUCTOR: 构造 方法 ; 

.LOCAL VARIABLE: 本 地 变量 ; 


:MODULE: 模块 (Java 9 引入 的 ) 。 





目标 可 以 有 多 个 ， 用 {表示 ， 比 如 @SuppressWarnings 的 @Target 束 
有 多 个 。Java 7 的 定义 为 : 





@Target({TYPE, FIELD, METHOD, PARAMETER， CONSTRUCTOR, LOCAL_VARIABLE}) 
@Retention(RetentionPolicy .SOURCE) 
public @interface SuppresswWarnings { 

String[] value(); 





如 果 没 有 声明 @Target， 默 认为 适用 于 所 有 类 型 。 


(@Retention 表 示 注 解 信 息 保留 到 什么 时 候 ， 取 值 只 能 有 一 个 ， 类 型 
为 RetentionPolicy， 它 是 一 个 枚 举 ， 有 三 个 取 值 。 


:SOURCE: 只 在 源 代码 中 保留 ， 编 译 器 将 代码 编译 为 字 节 码 文件 
后 就 会 丢掉 。 


CLASS: 保留 到 字 节 码 文件 中 ， 但 Java 虚 拟 机 将 class 文 件 加 载 到 内 
存 时 不 一 定 会 在 内 存 中 保留 。 


:RUNTIME: 一 直 保 留 到 运行 时 。 





如 果 没 有 声明 @Retention， 则 默认 为 CLASS 。 


@Override 和 @SuppressWarnings 都 是 给 编译 器 用 的 ， 所 以 
@Retention 都 是 Retention-Policy.SOURCE。 


可 以 为 注解 定义 一 些 参 数 ， 定 义 的 方式 是 在 注解 内 定义 一 些 方 法 ， 
比如 @Suppress-Warnings 内 定义 的 方法 value， 返 回 值 类 型 表示 参数 的 类 
型 ， 这 里 是 String[]。 使 用 @Suppress-Warnings 时 必须 给 value 提 供 值 ， 比 
如 : 





@Suppresswarnings(value={"deprecation", "unused"}) 





当 只 有 一 个 参数 ， 且 名 称 为 value 时 ， 提 供 参 数值 时 可 以 省 
略 "value="， 即 上 和 面 的 代码 可 以 简写 为 : 





@Suppresswarnings({"deprecation", "unused"}) 





注解 内 参数 的 类 型 不 是 什么 都 可 以 的 ， 合 法 的 类 型 有 基本 类 型 、 
String、Class、 枚 举 、 注 解 ， 以 及 这 些 类 型 的 数组 。 


参数 定义 时 可 以 使 用 default 指 定 一 个 默认 值 ， 比 如 ，Guice 中 Inject 


注解 的 定义 : 





@Target({ METHOD, CONSTRUCTOR, FIELD }) 
@Retention(RUNTIME) 
QDocumented 
public @interface Inject { 
boolean optional() default false; 
} 





它 有 一 个 参数 optional， 默 认 值 为 false。 如 果 类 型 为 String， 默 认 值 
可 以 为 "， 但 不 能 为 null。 如 果 定 义 了 参数 旦 没有 提供 默认 值 ， 在 使 用 
注解 时 必须 提供 具体 的 值 ， 不 能 为 null。 


@Inject 多 了 一 个 元 注解 @Documented， 它 表示 注解 信息 包含 到 后 
成 的 文档 中 。 


与 接口 和 类 不 同 ， 注 解 不 能 继承 。 不 过 注解 有 一 个 与 继承 有 关 的 元 
注解 @Inherited， 它 是 什么 意思 呢 ? 我 们 看 个 例子 : 





public class InheritDemo { 
@Inherited 
@Retention(Retentionpolicy .RUNTIME) 
static @interface Test { 


@Test 
static class Base { 


static class Child extends Base { 


public static void main(String[] args) { 
System.out.println(Child.class.isAnnotationpresent(Test.class)); 








Test 是 一 个 注解 ， 类 Base 有 该 注解 ，Child 继 承 了 Base 但 没有 声明 该 
注解 。main 方 法 检查 Child 类 是 个 有 Test 注 解 ， 输 出 为 tue， 这 是 因为 
Test 有 注解 @Inherited， 如 果 去 挥 ， 输 出 会 变 成 false。 


22.4 ”查看 注解 信息 


创建 了 注解 ， 融 可 以 在 程序 中 使 用 ， 注 解 指定 的 目标 ， 提 供需 要 的 
参数 ， 但 这 还 是 不 会 影响 到 程序 的 运行 。 要 影响 程序 ， 我 们 要 先 能 查看 
这 些 信息 。 我 们 主要 考虑 @Retention 为 RetentionPolicy.RUNTIME 的 注 
解 ， 利 用 反射 机 制 在 运行 时 进行 查看 和 利用 这 些 信息 。 


在 上 一 章 ， 我 们 提 到 了 反射 相关 类 中 与 注解 有 关 的 方法 ， 这 里 汇总 
说 明 下 ，Class、Field、Method、Constructor 中 都 有 如 下 方法 : 











// 获 取 所 有 的 注解 
public Annotation[] getAnnotations( ) 
// 获 取 所 有 本 元 素 上 直接 声明 的 注解 ， 忽 略 ijnherited 来 的 
public Annotation[] getDeclaredAnnotations() 
// 获 取 指 定 类 型 的 注解 ， 没 有 返回 null 
public <A extends Annotation> A getAnnotation(Class<A> annotationClass) 
// 判 断 是 否 有 指定 类 型 的 注解 
public boolean isAnnotationPresent( 
Class<? extends Annotation> annotationClass) 











































































































Annotation 是 一 个 接口 ， 它 表示 注解 ， 具 体 定义 为 : 





public interface Annotation { 
boolean equals(Object obj); 
int hashCode( ); 
String toString(); 
// 返 回 真正 的 注解 类 型 
Class<? extends Annotation> annotationType(); 



































实际 上 ， 内 部 实现 时 ， 所 有 的 注解 类 型 都 是 扩展 的 Annotation。 


对 于 Method 和 Contructor， 它 们 都 有 方法 参数 ， 而 参数 也 可 以 有 注 
解 ， 所 以 它们 都 有 如 下 方法 : 








public Annotation[][] getParameterAnnotations() 





返回 值 是 一 个 二 维 数组 ， 每 个 参数 对 应 一 个 一 维 数组 。 我 们 看 个 简 
单 的 例子 : 


[EE | 


public class MethodAnnotations { 
@Target (ElementType .PARAMETER) 
@Retention(Retentionpolicy .RUNTIME) 
static @interface QueryParam { 
String value(); 


} 

@Target (ElementType .PARAMETER) 

@Retention(Retentionpolicy .RUNTIME) 

static @interface DefaultValue { 
String value() default ""; 


public void hello(@QueryParam("action") String action, 
Q@QueryParam(" sort") @DefaultValue("asc") String sort){ 
A 


public static void main(String[] args) throws Exception { 
Class<?> cls = MethodAnnotations.class; 
Method method = cls.getMethod("hello", 
new Class[]{String.class, String.class}); 
Annotation[][] annts = method.getParameterAnnotations(); 
for(int i=0; i<annts.length; i++){ 
System.out.printin("annotations for paramter " + (i+1)); 
Annotation[] anntArr = annts[i]; 
for(Annotation annt : anntArr){ 
if(annt instanceof QueryParam){ 
QueryParam dp = (QueryParam)annt; 
System,out.println(qp.annotationType() 
.getSimpleName()+":"+ qdqp.value()); 
}else if(annt instanceof DefaultValue)t{ 
DefaultValue dv = (DefaultValue)annt; 
System,out,println(dv.annotationType() 
.getSimpleName()+":"+ dv.value()); 





这 里 定义 了 两 个 注解 @QueryParam 和 @DefaultValue， 都 用 于 修饰 
方法 参数 ， 方 法 hello 使 用 了 这 两 个 注解 ， 在 main 方 法 中 ， 我 们 演示 了 如 
何 获取 方法 参数 的 注解 信息 ， 输 出 为 : 





annotations for paramter 1 
QueryParam:action 
annotations for paramter 2 
QueryParam: sort 
DefaultValue:asc 





代码 比较 简单 ， 就 不 葡 述 了 。 
定义 了 注解 ， 通 过 反射 获取 到 注解 信息 ， 但 具体 怎么 利用 这 些 信息 


呢 ? 我 们 看 两 个 简单 的 示例 ， 一 个 是 定制 序列 化 ， 为 一 个 是 DI 依赖 注 
入 ) 容器 。 


22.5 注解 的 应 用 : 定制 序列 化 


在 上 一 音 ， 我 们 演示 了 一 个 简单 的 通用 序列 化 类 SimpleMapper， 在 
将 对 象 转换 为 字符 串 时 ， 格 式 是 固定 的 ， 本 节 演 示 如 何 对 输出 格式 进行 
定制 化 。 我 们 实现 一 个 简单 的 类 SimpleFormatter， 它 有 一 个 方法 : 





public static String format(Object obj) 





我 们 定义 两 个 注解 : @Label 和 @Format。@Label 用 于 定制 输出 字段 
的 名 称 ，@Format 用 于 定义 日 期 类 型 的 输出 格式 ， 它 们 的 定义 如 下 : 





@Retention(RUNTIME) 

@Target (FIELD) 

public @interface Label { 
String value() default ""; 


} 

@Retention(RUNTIME) 

@Target (FIELD) 

public @interface Format { 
String pattern() default "yyyy-MM-dd HH:mm:ss"; 
String timezone() default "GMT+8"; 

} 





可 以 用 这 两 个 注解 来 修饰 要 序列 化 的 类 字段 ， 比 如 : 





static class Student { 
@Label(" 姓 名 ") 
String name,; 
@Label(" 出 生日 期 " 
@Format (pattern="yyyy/MM/dd") 
Date born; 
@Label(" 分 数 ") 
double score; 


// 其 他 代码 





























我 们 可 以 这 样 来 使 用 SimpleFormatter: 





SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd"); 
Student zhangsan = new Student(" 张 三 ", sdf,.parse("1990-12-12"), 80.9d); 
System.out.println(SimpleFormatter.format(zhangsan)); 

















出 生日 期 1990/12/12 
分 数 : 80 .9 











可 以 看 出 ， 输 出 使 用 了 目 定 义 的 字段 名 称 和 日 期 格式 ， 
SimpleFormatter.format〈) 是 怎么 利用 这 些 注解 的 呢 ? 我 们 看 代码 ; 





public static String format(Object obj) { 
try { 
Class<?> cls = 0bj,getClass()， 
StringBuilder sb = new StringBuilder(); 
for(Field f : cls.getDeclaredFields()) { 
if(!f.isAccessible()) { 
f,setAccessible(true); 


} 
Label label f.getAnnotation(Label.class); 
String name label != null ? label.value() : f.getName(); 
Object value = f.get(obj); 
if(value != null && f.getType() == Date.class) { 
value = formatDate(f, value); 


sb.append(name + ": " + Value + "\n"); 
} 
return Sb,toString()， 
} catch (IllegalAccessException e) { 
throw new RuntimeException(e); 
} 





对 于 日 期 类 型 的 字段 ， 调 用 了 formatDate， 其 代码 为 : 





private static Object formatDate(Field f, Object value) { 
Format format = f.getAnnotation(Format.class); 
if(format != null) { 
SimpleDateFormat sdf = new SimpleDateFormat(format.pattern()); 
sdf.setTimeZone(TimeZone.getTimeZone(format.timezone())); 
return sdf.format(value); 


} 


return value; 





这 些 代码 都 比较 简单 ， 我 们 就 不 解释 了 。 


22.6 注解 的 应 用 : DI 容器 


我 们 再 来 看 一 个 简单 的 DI 容器 的 例子 。 我 们 引入 两 个 注解 : 一 个 是 
@SimpleInject;， 另 一 个 是 @SimpleSingleton， 先 来 看 @SimpleInject。 
1.@Simplelnject 


引入 一 个 注解 @SimpleInject， 修 饰 类 中 字段 ， 表 达 依 赖 关 系 ， 定 义 





@Retention(RUNTIME) 
@Target (FIELD) 
public @interface SimpleInject { 





我 们 看 两 个 简单 的 服务 ServiceA 和 ServiceB，ServiceA 依 赖 于 
ServiceB， 它 们 的 定义 如 代码 清单 22-1 所 示 。 


代码 清单 22-1 两 个 简单 的 服务 ServiceA 和 ServiceB 





public class ServiceA { 
@SimpleInject 
ServiceB b; 
public void callB(){ 
b.action( ); 


public class ServiceB { 
public void action(){ 
System.out.printin("I'm B"); 





ServiceA 使 用 @SimpleInject 表 达 对 ServiceB 的 依赖 。 


DI 容器 的 类 为 SimpleContainer， 提 供 一 个 方法 : 





public static <T> T getIinstance(Class<T> cls) 








本 程序 使 用 该 方法 获取 对 象 实例 ， 而 不 是 目 己 new， 使 用 方法 如 
下 所 示 : 





ServiceA a = SimpleContainer.getInstance(ServiceA.class); 
a.callB( ); 





SimpleContainer.getInstance 会 创建 需要 的 对 象 ， 并 配置 依赖 关系 ， 
其 代码 为 : 





public static <T> T getIinstance(Class<T> cls) { 
try { 

T obj = cls,newInstance( )， 

Field[] fields = cls.getDeclaredFields(); 

for(Field f : fields) { 

if(f.isAnnotationpresent(SimpleInject.class)) { 
if(!f.isAccessible()) { 
f.setAccessible(true); 


} 

Class<?> fieldCcls = f.getType(); 

f.,set(obj, getIinstance(fieldCcls)); 
} 


return obj; 


} catch (Exception e) { 
throw new RuntimeException(e); 
} 


} 





代码 假定 每 个 类 型 都 有 一 个 public 默 认 构 造 方法 ， 使 用 它 创 建 对 
象 ， 然 后 查看 每 个 字段 ， 如 果 有 SimpleInject 注 解 ， 就 根据 字段 类 型 获取 
该 类 型 的 实例 ， 并 设置 字段 的 值 。 


2.@SimpleSingleton 


在 上 面 的 代码 中 ， 每 次 获取 一 个 类 型 的 对 象 ， 都 会 新 创建 一 个 对 
象 ， 实 际 开 发 中 ， 这 可 能 不 是 期 望 的 结果 ， 期 望 的 模式 可 能 是 单 例 ， 即 
每 个 类 型 只 创建 一 个 对 象 ， 该 对 象 被 所 有 访问 的 代码 共享 ， 怎 么 满足 这 
种 需求 呢 ? 我 们 增加 一 个 注解 @SimpleSingleton， 用 于 修饰 类 ， 表 示 类 
型 是 单 例 ， 定 义 如 下 : 








@Retention(RUNTIME) 
@Target (TYPE) 
public @interface SimpleSingleton { 





我 们 可 以 这 样 修 饰 ServiceB: 





@SimpleSingleton 
public class ServiceB { 
public void action(){ 
System.out.printJln("I'm B"); 





SimpleContainer 也 需要 做 修改 ， 首 先 增加 一 个 静态 变量 ， 绥 存 创 建 
过 的 单 例 对 象 : 





private static Map<Class<?>, Object> instances = new ConcurrentHashMap<>(); 





getInstance 也 需要 做 修改 ， 如 下 所 示 : 





public static <T> T getInstance(Class<T> cls) { 
try { 
boolean singleton = cls.isAnnotationpPresent(SimpleSingleton.class); 
if(!singleton) { 
return createInstance(c]ls); 


Object obj = instances.get(c]ls); 
if(obj != null) { 
return (T) obj; 


synchronized (cls) { 
obj = instances.get(c]ls); 
if(obj == null) { 
obj = createInstance(cls); 
instances.put(cls, obj); 


} 


} 

return (T) obj; 
} catch (Exception e) { 

throw new RuntimeException(e); 
} 





首先 检查 类 型 是 否 是 单 例 ， 如 果 不 是 ， 就 直接 调用 createInstance 创 | 
建 对 象 。 人 否则 ， 检 查 缓存 ， 如 采 有 ， 直 接 返回 ， 如 采 没 有 ， 则 调用 
createInstance 创 建 对 象 ， 并 放 入 绥 存 中 。 


createInstance 与 第 一 版 的 getInstance 类 似 ， 代 码 为 : 





有 


private static <T> T createInstance(Class<T> cls) throws Exception { 
T obj = cls.newInstance(); 
Field[] fields = cls.getDeclaredFields(); 
for(Field f : fields) { 
if(f.isAnnotationPpresent(SimpleInject.class)) { 
if(!f.isAccessible()) { 
f.,setAccessible(true); 


} 

Class<?> fieldCls = f.getType(); 

f.,set(obj, getIinstance(fieldCcls)); 
} 


return obj; 





本 章 介绍 了 Java 中 的 注解 ， 包 括 注 解 的 使 用 、 自 定义 注解 和 应 用 示 
例 ， 示 例 的 完整 代码 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c85 下 。 


注解 提升 了 Java 语 言 的 表达 能 力 ， 有 效 地 实现 了 应 用 功能 和 确 层 功 
能 的 分 离 ， 框 架 / 库 的 程序 员 可 以 专注 于 底层 实现 ， 借 助 反 射 实现 通 用 
功能 ， 提 供 注解 给 应 用 程序 员 使 用 ， 应 用 程序 员 可 以 专注 于 应 用 功能 ， 
通过 简单 的 声明 式 注解 与 框架 / 库 进 行 协作 。 


下 一 章 ， 我 们 来 探讨 Java 中 一 种 更 为 动态 灵活 的 机 制 : 动态 代理 。 





第 23 章 ”动态 代理 


本 章 ， 我 们 来 探讨 Java 中 另外 一 个 动态 特性 : 动态 代理 。 动 态 代 理 
是 一 种 强大 的 功能 ， 它 可 以 在 运行 时 动态 创建 一 个 类 ， 实 现 一 个 或 多 个 
接口 ， 可 以 在 不 修改 原 有 类 的 基础 上 动态 为 通过 该 类 获取 的 对 象 添 加 方 
法 、 修 改行 为 ， 这 么 描述 比较 抽象 ， 下 文 会 具体 介绍 。 这 些 特性 使 得 它 
广泛 应 用 于 各 种 系统 程序 、 框 架 和 库 中 ， 比 如 Spring、Hibernate、 


MyBatis、Guice 等 。 








动态 代理 是 实现 面 问 切面 的 编程 AOP (Aspect Oriented 
Programming) 的 基础 。 切 面 的 例子 有 日 志 、 性 能 监控 、 权 限 检查 、 数 
据 库 事务 等 ， 它 们 在 程序 的 很 多 地 方 都 会 用 到 ， 代 码 都 差不多 ， 但 与 某 
个 具体 的 业务 逻辑 关系 也 不 太 和 密切 ， 如 果 在 每 个 用 到 的 地 方 都 写 ， 代 码 
uy 也 难以 维护 ，AOP 将 这 些 切面 与 主体 逻辑 相 分 离 ， 代 码 简 单 
LE. 雅 得 多 。 


和 注解 类 似 ， 在 大 部 分 的 应 用 编程 中 ， 我 们 不 需要 自己 实现 动态 代 
理 ， 而 只 需要 按照 框 染 和 库 的 文档 说 明 进行 使 用 就 可 以 了 。 不 过 ， 理 解 
动态 代理 有 助 于 我 们 更 为 深刻 地 理解 这 些 框架 和 库 ， 也 能 更 好 地 应 用 它 
们 ， 在 自己 的 业务 需要 时 ， 也 能 自己 实现 。 


要 理解 动态 代理 ， 我 们 首先 要 了 解 静 态 人 代理， 了 解 了 静态 代理 后 ， 
我 们 再 来 看 动态 代理 。 动 态 代理 有 两 种 实现 方式 : 一 种 是 Java SDK 提 供 
的 ;另外 一 种 是 第 三 方 库 〈 如 cglib) 提供 的 。 我 们 会 分 别 介绍 这 两 种 方 
式 ， 包 括 其 用 法 和 基本 实现 原理 ， 理 解 了 基本 概念 和 原理 后 ， 我 们 来 看 
一 个 简单 的 应 用 ， 实 现 一 个 极 简 的 AOP 框 架 。 




















23.1 宫 仿 代理 


我 们 首先 介绍 代理 。 代 理 是 一 个 比较 通用 的 词 ， 作 为 一 个 软件 设计 
模式 ， 它 在 《设计 模式 》 一 书 中 被 提出 ， 基 本 概念 和 日 第 生活 中 的 概念 
是 类 似 的 。 代 理 背 后 一 般 至 少 有 一 个 实际 对 象 ， 代 理 的 外 部 功能 和 实际 
对 象 一 般 是 一 样 的， 用 户 与 代理 打交道 ， 不 直接 接触 实际 对 象 。 虽 然 外 
部 功能 和 实际 对 象 一 样 ， 但 代理 有 它 存在 的 价值 ， 比 如 : 


1) 节省 成 本 比较 高 的 实际 对 象 的 创建 开销 ， 按 需 延迟 加 载 ， 创 建 
代理 时 并 不 真正 创建 实际 对 象 ， 而 只 是 保存 实际 对 象 的 地 址 ， 在 需要 时 
再 加 载 或 创建 。 

2) 执行 权限 检查 ， 代 理 检 查 权 限 后 ， 再 调用 实际 对 象 。 


3) 屏蔽 网 络 差 异 和 复杂 性 ， 代 理 在 本 地 ， 而 实际 对 象 在 其 他 服务 
器 上 ， 调 用 本 地 代理 时 ， 本 地 代理 请 求 其 他 服务 器 。 


代理 模式 的 代码 结构 也 比较 简单 ， 我 们 看 个 简单 的 例子 ， 如 代码 清 
单 代码 23-1 所 示 。 


代码 清单 23-1 静态 代理 示例 




















public class Simp1leStaticProxyDemo { 
static interface IService { 
public void sayHello(); 


} 
static class RealService implements IService { 
@Override 
public void sayHello() { 
System.out.printlin("hello"); 
} 


static class TraceProxy implements IService { 
private IService realService; 
public TraceProxy(IService realService) { 
this.realService = realService,; 


@Override 

public void sayHello() { 
System.out.printin("entering sayHello"); 
this.realService.sayHello(); 
System.out.printlin("leaving sayHello"); 


public static void main(String[] args) { 
IService realService = new RealService(); 
IService proxyService = new TraceProxy(realService); 
proxyService.sayHello(); 





代理 和 实际 对 象 一 般 有 相同 的 接口 ， 在 这 个 例子 中 ， 共 同 的 接口 是 
IService， 实 际 对 象 是 RealService， 代 理 是 TraceProxy。TraceProxy 内 部 
有 一 个 IService 的 成 员 变 量 ， 指 问 实 际 对 象 ， 在 构造 方法 中 被 初始 化 ， 
对 于 方法 sayHello 的 调用 ， 它 转发 给 了 实际 对 象 ， 在 调用 前 后 输出 了 一 
些 跟 躁 调试 信息 ， 程 序 输出 为 : 








entering sayHello 
hello 
Jeaving sayHello 





我 们 在 第 12 章 介绍 过 两 种 设计 模式 : 适 配 需 和 装饰 器 ， 它 们 与 代理 
模式 有 反 类 似 ， 它 们 的 背后 都 有 一 个 别 的 实际 对 象 ， 部 是 通过 组 合 的 方 
式 指 问 访 对象， 不 同 之 处 在 于 ， 适 配器 是 提供 了 一 个 不 一 样 的 新 接口 ， 
装饰 器 是 对 原 接口 起 到 了 “装饰 * 作 用， 可 能 是 增加 了 新 接口 、 修 改 了 原 
有 的 行为 等 ， 代 理 一 般 不 改变 接口 。 不 过 ， 我 们 并 不 想 强 调 它们 的 差 
别 ， 可 以 将 它们 看 作 代理 的 变 体 ， 统 一 看 行 。 


在 上 面 的 例子 中 ， 我 们 想 达 到 的 目的 是 在 实际 对 象 的 方法 调用 前 后 
加 一 些 调试 语句 。 为 了 在 不 修改 原 类 的 情况 下 达到 这 个 目的 ， 我 们 在 代 
码 中 创建 了 一 个 代理 类 TraceProxy， 它 的 代码 是 在 写 程序 时 固定 的 ， 所 
以 称 为 静态 代理 。 


输出 跟 踩 调试 信息 是 一 个 通用 需求 ， 可 以 想象 ， 如 采 每 个 类 都 需 
要 ， 而 又 不 和 希望 修改 类 定义 ， 我 们 需要 为 每 个 类 创建 代理 ， 实 现 所 有 接 
口 ， 这 个 工作 就 太 烦 琐 了 ， 如 条 再 有 其 他 的 切面 需求 ， 整 个 工作 可 能 
要 重 来 一 过 。 这 时 ， 就 需要 动态 代理 了 ， 主 要 有 两 种 方式 实现 动态 代 
理 : Java SDK 和 第 三 方 库 cglib， 我 们 先 来 介绍 Java SDK。 











23.2 Java SDK 动 态 代理 
我 们 先 介绍 它 的 用 法 ， 然 后 介绍 实现 原理 ， 最 后 分 析 它 的 优点 。 


23.2.1 用 法 





在 静态 代理 中 ， 代 理 类 是 直接 定义 在 代码 中 的 ， 在 动态 代理 中 ， 代 
理 类 是 动态 生成 的 ， 怎 么 动态 生成 呢 ? 我 们 用 动态 代理 实现 前 面 的 例 
子 ， 如 代码 清单 23-2 所 示 。 


代码 清单 23-2 ”使 用 Java SDK 实 现 动态 代理 示例 











public class SimpleJDKDynamicProxyDemo { 
static interface IService { 
public void sayHello(); 


static class RealService implements IService { 
@Override 
public void sayHello() { 
System.out.printlin("hello"); 


static class SimpleInvocationHandler implements InvocationHandler { 

private Object realObj; 

public SimpleInvocationHandler(Object realobj) { 
thlis.realobj = realO0bj; 

} 

@Override 

public Object invoke(Object proxy, Method method, 

Object[] args) throws Throwable { 

System.out.printin("entering ”+ method.getName()); 
Object result = method.invoke(real0bj, args); 
System.out.printin("leaving " + method.getName()); 
return result,; 


} 


public static void main(String[] args) { 
IService realService = new RealService(); 
IService proxyService = (IService) Proxy.newPproxyInstance( 
IService.class.getClassLoader(), new Class<?>[] { IService.class }, 
new SimpleInvocationHandler(realService)); 
proxyService.sayHello(); 





代码 看 起 来 更 为 复杂 了 ， 这 有 什么 用 呢 ? 别 着 急 ， 我 们 慢 慢 解释 。 


IService 和 Real-Service 的 定义 不 变 ， 程 序 的 输出 也 没 变 ， 但 代理 对 象 
proxyService 的 创建 方式 变 了 ， 它 使 用 java.lang.reflect 包 中 的 Proxy 类 的 静 
态 方法 newProxyInstance 来 创建 代理 对 象 ， 这 个 方法 的 声明 如 下 : 





public static Object newProxyInstance(ClassLoader loader, 
Class<?>[] interfaces, InvocationHandler h) 





它 有 三 个 参数 ， 具 体 如 下 。 


1) loader 表 示 类 加 载 器 ， 下 一 章 我 们 会 单独 探讨 ， 例 子 使 用 和 
IService 一 样 的 类 加 载 器 。 


2) interfaces 表 示 代理 类 要 实现 的 接口 列表 ， 是 一 个 数组 ， 元 素 的 
类 型 只 能 是 接口 ， 不 能 是 普通 的 类 ， 例子 中 只 有 一 个 IService。 


3) h 的 类 型 为 InvocationHandler， 它 是 一 个 接口 ， 也 定义 在 
java.lang.reflect 包 中 ， 它 只 定义 了 一 个 方法 invoke， 对 代理 接口 所 有 方法 
的 调用 都 会 转 给 该 方法 。 


newProxyInstance 的 返回 值 类 型 为 Object， 可 以 强制 转换 为 interfaces 
数组 中 的 某 个 接口 类 型 。 这 里 我 们 强制 转换 为 了 IService 类 型 ， 需 要 注 
意 的 是 ， 它 不 能 强制 转换 为 某 个 类 类 型 ， 比如 RealService， 即 使 它 实际 
代理 的 对 象 类 型 为 RealService。 











SimpleInvocationHandler 实 现 了 InvocationHandler， 它 的 构造 方法 接 
受 一 个 参数 realObj 表 示 被 代理 的 对 象 ，invoke 方 法 处 理 所 有 的 接口 调 
用 ， 它 有 三 个 参数 :; 


1) proxy 表 示 代 理 对 象 本 映 ， 需 要 注意 ， 它 不 是 被 代理 的 对 象 ， 这 
个 参数 一 般 用 处 不 大 。 


2) method 表 示 正 在 被 调用 的 方法 。 
3) args 表 示 方 法 的 参数 。 
在 SimpleInvocationHandler 的 invoke 实 现 中 ， 我 们 调用 了 method 的 


invoke 方 法 ， 传 递 了 实际 对 象 realObj 作 为 参数 ， 达 到 了 调用 实际 对 象 对 
应 方法 的 目的 ， 在 调用 任何 方法 前 后 ， 我 们 输出 了 跟 踩 调试 语句 。 需 要 


注意 的 是 ， 不 能 将 proxy 作 为 参数 传递 给 method.invoke， 比如 : 





Object result = method.invoke(proxy, args); 





上 面 的 语句 会 出 现 死 循 环 ， 因 为 proxy 表 示 当 前 代理 对 象 ， 这 又 会 
调用 到 SimpleIn-vocationHandler 的 invoke 方 法 。 


23.2.2 ”基本 原理 





看 了 上 面 的 介绍 是 不 是 更 坚 了 ， 没 关系 ， 看 下 
Proxy.newProxyInstance 的 内 部 束 理 解 了 。 代 人 码 清 单 23-2 中 创建 
proxyService 的 代码 可 以 用 如 下 代码 代 蔡 : 





Class<?> proxyCls = Proxy.getProxyClass(IService.class.getCclassLoader(), 
new Class<?>[] { IService.class }); 
Constructor<?> ctor = proxyCls.getConstructor( 
new Class<?>[] { InvocationHandler.class }); 
InvocationHandler handler = new SimpleInvocationHandler(realService); 
IService proxyService = (IService) ctor.newInstance(handler); 





分 为 三 步 : 
1) 通过 Proxy.getProxyClass 创 建 代理 类 定义 ， 类 定义 会 被 缓存 ; 


2) 获取 代理 类 的 构造 方法 ， 构 造 方法 有 一 个 InvocationHandler 类 型 
的 参数 ; 


3) 创建 InvocationHandler 对 象 ， 创 建 代 理 类 对 象 。 

Proxy.getProxyClass 需 要 两 个 参数 : 一 个 是 ClassLoader; 另 一 个 是 
接口 数组 。 写 会 动态 生成 一 个 类 ， 类 名 以 $Proxy 开 头 ， 后 跟 一 个 数字 。 
对 于 上 面 的 例子 ， 动 态 生 成 的 类 定义 如 代码 清单 23-3 所 示 ， 为 简化 起 
见 ， 我 们 忽略 了 异常 处 理 的 代码 。 


代码 清单 23-3 Java SDK 动 态 生 成 的 代理 类 示例 











final class $Proxy0 extends Proxy implements 
SimpleJDKDynamicProxyDemo.IService { 


private static Method m1; 

private static Method m3; 

private static Method m2; 

private static Method moO; 

public $Proxy0(InvocationHandler paramInvocationHandler) { 
super(paramInvocationHandler); 


public final boolean equals(Object paramobject) { 
return((Boolean) this.h.invoke(this, mi1, 
new Object[] { paramobject })).booleanVvalue(); 


} 
public final void sayHello() { 
this.h.invoke(this, m3, null]l); 


} 
public final String toString() { 

return (String) this.h,.invoke(this, m2, null); 
} 


public final int hashCode() { 
return ((Integer) this.h.invoke(this, m0O, null)).intValue(); 


} 
static { 
m1 = Class.forName("java.lang.O0bject").getMethod("equals", 
new Class[] { Class.forName("java.lang.O0bject") }); 
m3 = Class.forName( 
"laoma.demo.proxy.SimpleJDKDynamicProxyDemo$IService") 
.getMethod("sayHello",new Class[0]); 
m2 = Class.forName("java.lang.Object") 
.getMethod("toString", new Class[0]); 
m0 = Class.forName("java.lang.Object") 
.getMethod("hashCode", new Class[0]); 
} 





$Proxy0 的 父 类 是 Proxy， 它 有 一 个 构造 方法 ， 接 受 一 个 
InvocationHandler 类 型 的 参数 ， 保 存 为 了 实例 变量 h，h 定 义 在 父 类 Proxy 
中 ， 它 实现 了 接口 IService， 对 于 每 个 方法 ， 如 sayHello， 它 调用 
InvocationHandler 的 invoke 方 法 ， 对 于 Object 中 的 方法 ， 如 hash-Code、 
edquals 和 toString，$Proxy0 同 样 转发 给 了 InvocationHandler。 


可 以 看 出 ， 这 个 类 定义 本 身 与 被 代理 的 对 象 没 有 关系 ， 与 
InvocationHandler 的 具体 实现 也 没有 关系 ， 而 主要 与 接口 数组 有 关 ， 给 
定 这 个 接口 数组 ， 它 动态 创建 每 个 接口 的 实现 代码 ， 实现 就 是 转发 给 
InvocationHandler， 与 被 代理 对 象 的 关系 以 及 对 它 的 调用 由 
InvocationHandler 的 实现 管理 。 


我 们 是 怎么 知道 $Proxy0 的 定义 的 呢 ? 对 于 Oracle 的 JVM， 可 以 配置 
java 的 一 个 属性 得 到 ， 比 如 : 








java -Dsun.misc.ProxyGenerator.saveGeneratedFiles=true shuo.laoma.dynamic,.c86.Simple 


以 上 命令 会 把 动态 生成 的 代理 类 $Proxy0 保 存 到 文件 $Proxy0.class 
中 ， 通 过 一 些 反 编 译 器 工具 比如 JD-GUI (http://jd.benow.ca/ ) 就 可 以 得 
到 源码 。 


理解 了 代理 类 的 定义 ， 后 面 的 代码 就 比较 容易 理解 了 ， 就 是 获取 构 
造 方法 ， 创 建 代理 对 象 。 


23.2.3 动态 代理 网 优 操 





相 比 静态 代理 ， 动 态 代理 看 起 来 肪 烦 了 很 多 ， 它 有 什么 好 处 呢 ? 使 
用 动态 代理 ， 可 以 编写 通用 的 代理 逻辑 ， 用 于 各 种 类 型 的 被 代理 对 象 ， 
而 不 需要 为 每 个 被 代理 的 类 型 都 创建 一 个 静态 代理 类 。 看 个 简单 的 示 
例 ， 如 代码 清单 23-4 所 示 。 


代码 清单 23-4 通用 的 动态 代理 类 示例 








public class GeneralProxyDemo { 
static interface IServiceA { 
public void sayHello(); 


static class ServiceAImpl implements IServiceA { 
@Override 
public void sayHello() { 
System.out.printlin("hello"); 
} 
} 
static interface IServiceB { 
public void fly(); 


static class ServiceBImpl] implements IServiceB { 
@Override 
public void fly() { 
System.out.printin("flying"); 


static class SimpleInvocationHandler implements InvocationHandler { 
private Object realobj ' 
public SimpleInvocationHandler(Object realobj) { 
this.realobj = real0bj; 


@Override 
public Object invoke(Object proxy, Method method, Object[] args) 
throws Throwable { 
System.out.printin("entering ”+ real0bj,getClass() 
.getSimpleName() + "::" + method.getName()); 
Object result = method.invoke(real0bj, args); 
System.out.printin("leaving " + real0bj,getClass() 
.getSimpleName() + "::" + method.getName()); 


return result,; 
} 
} 
private static <T> T getProxy(Class<T> intf, T realobj) { 


return (T) Proxy.newPproxyInstance(intf.getCclassLoader(), 
new Class<?>[] { intf }, new SimpleInvocationHandler(real0bj)); 


public static void main(String[] args) throws Exception { 
IServiceA a = new ServiceAImpl(); 
IServiceA apProxy = getProxy(IServiceA.class, a); 
aProxy.sayHello( ); 
IServiceB b = new ServiceBImpl(); 
IServiceB bProxy = getProxy(IServiceB.class, b); 
bproxy.fly(); 








在 这 个 例子 中 ， 有 两 个 接口 I ServiceA 和 IServiceB， 它 们 对 应 的 实现 
类 是 Service-AImpl 和 ServiceBImp1， 虽 然 它 们 的 接口 和 实现 不 同 ， 但 利 
用 动态 代理 ， 它 们 可 以 调用 同样 的 方法 getProxy 获 取代 理 对 象 ， 共 享 同 
样 的 代理 逻辑 SimpleInvocationHandler， 即 在 每 个 方法 调用 前 后 输出 一 
条 跟踪 调试 语句 。 程 序 输出 为 : 





entering ServiceAImpl: :sayHello 
hello 

Jeaving ServiceAImpl::sayHello 
entering ServiceBImpl::fly 
flying 

Jeaving ServiceBImpl: :fly 





23.3 cglib 动 态 代理 


Java SDK 动 态 代理 的 局 限 在 于 ， 它 只 能 为 接口 创建 代理 ， 返 回 的 代 
理 对 象 也 只 能 转换 到 某 个 接口 类 型 ， 如 果 一 个 类 没有 接口 ， 或 者 希望 
代理 非 接 口中 定义 的 方法 ， 那 就 没有 办 法 了 。 有 一 .1 
cglib Chttps: //github.com/cglib/cglib ) ， 可 以 做 到 这 一 点 ，Spring、 
Hibernate 等 都 使 用 该 类 库 。 我 们 看 个 简单 的 例子 ， 如 代码 清单 23-5 所 
示 。 


代码 清单 23-5 cglib 动 态 代理 示例 





public class SimpleCGLibDemo { 
static class RealService { 
public void sayHello() { 
System.out.printin("hello"); 


static class SimpleInterceptor implements MethodInterceptor { 
@Override 
public Object intercept(Object object, Method method, 
Object[] args, MethodProxy proxy) throws Throwable { 
System.out.printin("entering ”+ method.getName()); 
Object result = proxy.invokeSuper(object, args); 
System.out.printin("leaving " + method.getName()); 
return result,; 
} 
} 
private static <T> T getProxy(Class<T> cls) { 
Enhancer enhancer = new Enhancer(); 
enhancer .setSuperclass(cls); 
enhancer .setcallback(new SimpleInterceptor()); 
return (T) enhancer.create(); 


public static void main(String[] args) throws Exception { 
RealService proxyService = getProxy(RealService.class); 
proxyService.sayHello(); 








RealService 表 示 被 代理 的 类 ， 它 没有 接口 。getProxy《〈) 为 一 
生成 代理 对 象 ， 这 个 代理 对 象 可 以 安全 地 转换 为 被 代理 类 的 。 它 本 
用 了 cglib 的 Enhancer 类 。Enhancer 类 的 setSuperclass 设 置 被 代理 的 类 
setCallback 设 置 被 代理 类 的 public 非 final 方 法 被 调用 时 的 处 理 类 。 
Enhancer 文 持 多 种 类 型 ， 这 里 使 用 的 类 实现 了 MethodInterceptor 接 口 ， 
它 与 Java SDK 中 的 InvocationHandler 有 点 类 似 ， 方 法 名 称 变 成 了 





intercept， 多 了 一 个 MethodProxy 类 型 的 参数 。 


与 前 面 的 mvocationHandler 不 同 ，SimpleInterceptor 中 没有 被 代理 的 
对 象 ， 它 通过 MethodProxy 的 invokeSuper 方 法 调用 被 代理 类 的 方法 : 





Object result = proxy.invokeSuper(object, args); 





注意 ， 它 不 能 这 样 调用 被 代理 类 的 方法 : 





Object result = method.invoke(object, args); 





object 是 代理 对 象 ， 调 用 这 个 方法 还 会 调用 到 SimpleInterceptor 的 
intercept 方 法 ， 造 成 死 循环 。 


在 main 方 法 中 ， 我 们 也 没有 创建 被 代理 的 对 象 ， 创 建 的 对 象 直接 就 
是 代理 对 象 。 


cglib 的 实现 机 制 与 Java SDK 不 同 ， 它 是 通过 继承 实现 的 ， 它 也 是 
动态 创建 了 一 个 类 ， 但 这 个 类 的 父 类 是 被 代理 的 类 ， 代 理 类 重 写 了 父 类 
的 所 有 public 非 final 方 法 ， 改 为 调用 Callback 中 的 相关 方法 ， 在 上 例 中 ， 
调用 SimpleInterceptor 的 intercept 方 法 。 








23.4 Java SDK 代 理 与 cglib 代 理 比较 





Java SDK 代 理 面 向 的 是 一 组 接口 ， 它 为 这 些 接口 动态 创建 了 一 个 
实现 类 。 接 口 的 具体 实现 逻辑 是 通过 上 自 定 义 的 mvocationHandler 实 现 
的 ， 这 个 实现 是 目 定 义 的 ， 也 束 是 说 ， 其 背后 都 不 一 定 有 真正 被 代理 的 
对 象 ， 也 可 能 有 多 个 实际 对 象 ， 根 据 情 况 动态 选择 。cglib 代 理 面 癌 的 是 
ee 
法 。 


从 代理 的 角度 看 ，Java SDK 代 理 的 是 对 象 ， 需要 先 有 一 个 实际 对 
象 ， 自 定义 的 InvocationHandler 引 用 该 对 象 ， 然 后 创建 一 个 代理 类 和 代 
理 对 象 ， 客 户 端 访问 的 是 代理 对 象 ， 代 理 对 象 最 后 再 调用 实际 对 象 的 方 
法 ; cglib 代 理 的 是 类 ， 创建 的 对 象 只 有 一 个 。 


如 果 目 的 都 是 为 一 个 类 的 方法 增强 功能 ，Java SDK 要 求 该 类 必须 有 
接口 ， 且 只 能 处 理 接 口中 的 方法 ，cglib 没 有 这 个 限制 。 











23.5 ”动态 代理 的 应 用 : AOP 


利用 cglib 动 态 代 理 ， 我 们 实现 一 个 极 简 的 AOP 框 架 ， 演 示 AOP 的 基 
本 思路 和 技术 ， 先 来 看 这 个 框 染 的 用 法 ， 然 后 分 析 其 实现 原理 。 


23.5.1 用 法 


我 们 添加 一 个 新 的 注解 @Aspect， 其 定义 为 : 





@Retention(RUNTIME) 

@Target (TYPE) 

public @interface Aspect { 
Class<?>[] value(); 

} 





它 用 于 注解 切面 类 ， 它 有 一 个 参数 ， 可 以 指定 要 增强 的 类 ， 比 如 : 





@Aspect({ServiceA.class, ServiceB.class}) 
public class ServiceLogAspect 





ServiceLogAspect 就 是 一 个 切面 ， 它 负责 类 ServiceA 和 ServiceB 的 日 
志 切 面 ， 即 为 这 两 个 类 增加 日 志 功 能 。 再 如 : 





@Aspect( {ServiceB.class}) 
public class ExceptionAspect 





ExceptionAspect 也 是 一 个 切面 ， 它 负责 类 ServiceB 的 异常 切面 。 


这 些 切 面 类 与 主体 类 怎么 协作 呢 ? 我 们 约定 ， 切 面 类 可 以 声明 三 个 
方法 before/afterexception， 在 主体 类 的 方法 调用 前 /调用 后 /出 现 异 常 时 
分 别 调用 这 三 个 方法 ， 这 三 个 方法 的 声明 需 符合 如 下 签名 : 








public static void before(Object object, Method method, Object[] args ) 
public static void after(Object object, Method method, 

Object[] args, Object result) 
public static void exception(Object object, Method method, 


Object[] args, Throwable e) 





object、method 和 args 与 cglib MethodInterceptor 中 的 invoke 参 数 一 
样 ，after 中 的 result 表 示 方 法 执行 的 结果 ，exception 中 的 e 表 示 发 生 的 异 


常 类 型 。 


ServiceLogAspect 实 现 了 before 和 after 方 法 ， 加 了 一 些 日 志 ， 如 代码 
清单 23-6 所 示 O 


代码 清单 23-6 日 志 切 面 类 





@Aspect({ ServiceA.class, ServiceB.class }) 
public class ServiceLogAspect { 
public static void before(Object object, Method method, Object[] args) { 
System,.out.printJln("entering ”+ method.getDeclaringClass() 
.getSimpleName() + "::" + method.getName() 
+ ", args: " + Arrays.toString(args)); 


} 
public static void after(Object object, Method method, Object[] args, 
Object result) { 
System.out.println("leaving " + method.getDeclaringClass() 
.getSimpleName() + "::" + method.getName() 
+ ", result: " + result); 








ExceptionAspect 只 实现 exception 方 法 ， 在 异常 发 生 时 ， 输 出 一 些 信 
已 ， 如 代码 清单 23-7 所 示 。 


代码 清单 23-7 异常 切面 类 





@Aspect({ ServiceB.class }) 
public class ExceptionAspect { 
public static void exception(Object object, 
Method method, Object[] args, Throwable e) { 
System.err.println("exception when calling: " 
+ method.getName() + "," + Arrays.toString(args)); 





ServiceLogAspect 的 目的 是 在 类 ServiceA 和 ServiceB 所 有 方法 的 执行 
前 后 加 一 些 日 志 ， 而 ExceptionAspect 的 目的 是 在 类 ServiceB 的 方法 执行 
出 现 异 常 时 收 到 通知 并 输出 一 些 信息 。 它 们 都 没有 修改 类 ServiceA 和 
ServiceB 本 身 ， 本 二 做 的 事 是 比较 通用 的 ， 与 ServiceA 和 ServiceB 的 具体 


逻辑 关系 也 不 密切 ， 但 又 想 改 变 ServiceA/ServiceB 的 行为 ， 这 就 是 AOP 
的 思维 。 


只 是 声明 一 个 切面 类 是 不 起 作用 的 ， 我 们 需要 与 第 22 章 介绍 的 DI 容 
器 结合 起 来 。 我 们 实现 一 个 新 的 容器 CGLibContainer， 它 有 一 个 方法 : 





public static <T> T getInstance(Class<T> cls) 








通过 该 方法 获取 ServiceA 或 ServiceB， 它 们 的 行为 就 会 被 改变 ， 
ServiceA 和 ServiceB 的 定义 与 第 22 章 一 样 ， 如 代码 清单 22-1 所 示 ， 这 里 
就 不 重复 了 。 


通过 CGLibContainer 获 取 ServiceA， 会 自动 应 用 ServiceLogAspect， 
比如 : 





ServiceA a = CGLibContainer.getIinstance(ServiceA.class); 
a.callB( ); 





输出 为 : 





entering ServiceA::callB, args: [] 
entering ServiceB: :action, args: [] 
I'mB 

Jeaving ServiceB::action, result: null 
leaving ServiceA::callB, result: null 





23.5.2 ”实现 原理 


这 是 怎么 做 到 的 呢 ? CGLibContainer 在 初始 化 的 时 候 ， 会 分 析 带 有 
@Aspect 注 解 的 类 ， 分 析出 每 个 类 的 方法 在 调用 前 /调用 后 /出 现 异 常 时 
应 该 调用 哪些 方法 ， 在 创建 该 类 的 对 象 时 ， 如 果 有 需要 被 调用 的 方法 ， 
则 创建 一 个 动态 代理 对 象 ， 下 面 我 们 具体 来 看 下 代码 。 


为 简化 起 见 ， 我 们 基于 第 22 章 介绍 的 DI 容 器 的 第 一 个 版 本 ， 即 每 次 
获取 对 象 时 都 创建 一 个 ， 不 文 持 单 例 。 我 们 定义 一 个 枚 举 
InterceptPoint， 表 示 切 点 (调用 前 /调用 后 /出 现 异常 〉: 








public static enum InterceptPoint { 
BEFORE， AFTER， EXCEPTION 
} 








在 CGLibContainer 中 定义 一 个 静态 变量 ， 表 示 每 个 类 的 每 个 切 点 的 
方法 列表 ， 定 义 如 下 : 





static Map<Class<?>, Map<InterceptPoint, List<Method>>> interceptMethodsMap 
= new HashMap<>(); 





我 们 在 CGLibContainer 的 类 初始 化 过 程 中 初始 化 该 对 象 ， 方 法 是 分 
析 每 个 带 有 Q@Aspect 注 解 的 类 ， 这 些 类 一 般 可 以 通过 扫描 所 有 的 类 得 
到 ， 为 简化 起 见 ， 我 们 将 它们 写 在 代码 中 ， 如 下 所 示 : 





static Class<?>[] aspects = new Class<?>[] { 
ServiceLogAspect.class, ExceptionAspect.class }; 





分 析 这 些 带 @Aspect 注 解 的 类 ， 并 初始 化 interceptMethodsMap 的 代 
码 如 下 上 所 示 : 





static { 
init(); 


private static void init() { 
for(Class<?> cls : aspects) { 
Aspect aspect = cls.getAnnotation(Aspect.class); 
if(aspect != null) { 
Method before = getMethod(cls, "before", new Class<?>[] { 
Object.class, Method.class, Object[].class }); 
Method after = getMethod(cls, "after", new Class<?>[] { 
Object.class, Method.class, Object[].class, Object.class }); 
Method exception = getMethod(cls, "exception", new Class<?>[] { 
Object.class, Method.class, Object[].class, Throwable.class }); 
Class<?>[] intercepttedArr = aspect.value(); 
for(Class<?> interceptted : intercepttedArr) { 
addInterceptMethod(interceptted, 

InterceptPoint.BEFORE, before); 
addInterceptMethod(interceptted, InterceptPoint.AFTER, after); 
addInterceptMethod(interceptted, 

InterceptPoint , EXCEPTION，exception) ， 


对 每 个 切面 ， 即 带 有 Q@Aspect 注 解 的 类 cls， 查 找 其 
before/after/exception 方 法 ， 调 用 方法 addInterceptMethod 将 其 加 入 目标 类 
的 切 点 方法 列表 中 ，addInterceptMethod 的 代码 为 : 





private static void addInterceptMethod(Class<?> cls, 
InterceptPoint point, Method method) { 
if(method == null) { 
return; 
} 


Map<InterceptPoint, List<Method>> map = interceptMethodsMap.get(c1ls); 
if(map == null) { 

map = new HashMap<>(); 

interceptMethodsMap.put(cls, map); 


} 
List<Method> methods = map.get(point),; 
if(methods == null) { 
methods = new ArrayList<>(); 
map.put(point, methods); 


methods.add(method); 





准备 好 了 每 个 类 的 每 个 切 点 的 方法 列表 ， 我 们 来 看 根据 类 型 创建 实 
例 的 代码 : 





private static <T> T createInstance(Class<T> cls) 
throws InstantiationException, IllegalAccessException { 
if(!interceptMethodsMap.containsKey(cls)) { 
return (T) cls.newInstance(); 
} 


Enhancer enhancer = new Enhancer(); 

enhancer .setSuperclass(cls); 

enhancer .setcallback(new AspectInterceptor()); 
return (T) enhancer ,create()， 





如 果 类 型 cls 不 需要 增强 ， 则 直接 调用 cls.newInstance () ， 否 则 使 
用 cglib 创 建 动 态 代理 ，callback 为 AspectInterceptor， 其 代码 为 : 





static class AspectInterceptor implements MethodInterceptor { 
Q@Override 
public Object intercept(Object object, Method method, 
Object[] args, MethodProxy proxy) throws Throwable { 
// 执 行 before 方 法 
List<Method> beforeMethods = getInterceptMethods( 
object.getClass().getSuperclass(), InterceptPoint .BEFORE); 
for(Method m : beforeMethods) { 
m.invoke(null, new Object[] { object, method, args }); 





try { 
// 调 用 原始 方法 
Object result = proxy.invokeSuper(object, args); 
// 执 行 after 方 法 
List<Method> afterMethods = getInterceptMethods( 
object.getCclass().getSuperclass(), InterceptPoint.AFTER); 

for(Method m : afterMethods) { 

m.invoke(null, new Object[] { object, method, args, result }); 
} 


return result,; 

} catch (Throwable e) { 
// 执 行 exception 方 法 
List<Method> exceptionMethods = getInterceptMethods( 

object.getClass().getSuperclass(), InterceptPoint.EXCEPTION); 
for(Method m : exceptionMethods) { 

m.invoke(null, new Object[] { object, method, args, e }); 
} 


throw e; 






































这 上段 代码 也 容易 理解 ， 它 根据 原始 类 的 实际 类 型 查找 应 该 执行 的 
before/after/exception 方 法 列表 ， 在 调用 原始 方法 前 执行 before 方 法 ， 执 
行 后 执行 after 方 法 ， 出 现 异 和 常 时 执行 exception 方 法 。getInterceptMethods 
方法 的 代码 为 : 








static List<Method> getInterceptMethods(Class<?> cils, 
InterceptPoint point) { 
Map<InterceptPoint, List<Method>> map = interceptMethodsMap.get(c1ls); 
if(map == null) { 
return Collections.emptyList(); 
List<Method> methods = map.get(point); 
if(methods == null) { 
return Collections.emptyList(); 
} 


return methods,; 





这 段 代 码 也 容易 理解 。CGLibContainer 最 终 的 getInstance 方 法 就 简 
单 了 ， 它 调用 create-Instance 创 建 实 例 ， 代 码 如 下 所 示 : 





public static <T> T getInstance(Class<T> cls) { 
try { 

T obj = createInstance(cls); 

Field[] fields = cls.getDeclaredFields(); 

for(Field f : fields) { 

if(f.isAnnotationpresent(SimpleInject.class)) { 
if(!f.isAccessible()) { 
f.setAccessible(true); 


} 
Class<?> fieldCcls = f.getType(); 
f.set(obj, getIinstance(fieldCcls)); 
} 
} 
return obj; 
} catch (Exception e) 
throw new RuntimeException(e); 
} 
} 





相 比 完整 的 AOP 框 架 ， 这 个 AOP 的 实现 是 非常 粗糙 的 ， 主 要 用 于 解 
释 动态 代理 的 应 用 和 AOP 的 一 些 基 本 思路 和 原理 。 完 整 的 代码 在 github 
上 ， 地 址 为 https://github.com/swift-ma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c86 下 。 


本 章 探 讨 了 Java 中 的 代理 ， 从 静态 代理 到 两 种 动态 代理 。 动 态 代 理 
广泛 应 用 于 各 种 系统 程序 、 框 染 和 库 中 ， 用 于 为 应 用 程序 员 提 供 易 用 的 
支持 、 实 现 AOP， 以 及 其 他 灵活 通用 的 功能 ， 理 解 了 动态 代理 ， 我 们 束 
能 更 好 地 利用 这 些 系统 程序 、 框 如 和 库 ， 在 需要 的 时 候 ， 也 可 以 目 己 创 
建 动态 代理 。 


下 一 音 ， 我 们 来 进一步 理解 Java 中 的 类 加 载 过 程 ， 探 讨 如 何 利用 目 
定义 的 类 加 载 器 实现 更 为 动态 强大 的 功能 。 


第 24 半 ”类 加 载 机 制 


在 前 几 间 中， 我 们 多 次 提 到 了 类 加 载 器 ClassLoader， 本 章 束 来 详细 
讨论 Java 中 的 类 加 载 机 制 与 ClassLoader。 


类 加 载 右 ClassLoader 束 是 加 载 其 他 类 的 类 ， 它 负责 将 字 节 码 文 件 加 
载 到 内 存 ， 创 建 Class 对 象 。 与 之 前 介绍 的 反射 、 注 解 和 动态 代理 一 样 ， 
在 大 部 分 的 应 用 编程 中 ， 我 们 需要 目 己 实现 ClassLoader。 


不 过 ， 理 解 类 加 载 的 机 制 和 过 程 ， 有 助 于 我 们 更 好 地 理解 之 前 介绍 
的 内 容 。 在 反射 一 章 ， 我 们 介绍 过 Class 的 静态 方法 Class.forName， 理 解 
类 加 载 器 有 助 于 我 们 更 好 地 理解 该 方法 。 


ClassLoader 一 般 是 系统 提供 的 ， 不 需要 上 自己 实现 ， 不 过 ， 通 过 创建 
目 定义 的 ClassLoader， 可 以 实现 一 些 强 大 灵活 的 功能 ， 比 如 : 


1) 热 部 署 。 在 不 重 局 Java 程 序 的 情况 下 ， 动 态 蔡 换 类 的 实现 ， 比 
如 Java Web 开 发 中 的 JSP 技 术 就 利用 自 定 义 的 ClassLoader 实 现 修改 JSP 代 
码 即 生效 ，OSGI (Open Service Gateway Initiative) 框架 使 用 自 定义 
ClassLoader 实 现 动态 更 新 。 


2) 应 用 的 模块 化 和 相互 隔离 。 不 同 的 ClassLoader 可 以 加 载 相同 的 
类 但 互相 隔离 、 互 不 影响 。Web 应 用 服务 器 如 Tomcat 利 用 这 一 点 在 一 个 
程序 中 管理 多 个 Web 应 用 程序 ， 每 个 web 应 用 使 用 上 自己 的 ClassLoader， 
这 些 Web 应 用 互 不 干扰 。OSGI 和 Java 9 利用 这 一 点 实现 了 一 个 动态 模块 
化 架构 ， 每 个 模块 有 自己 的 ClassLoader， 不 同 模块 可 以 互 不 干扰 。 


3) 从 不 同 地 方 灵活 加 载 。 系统 默认 的 ClassLoader 一 般 从 本 地 
的 .class 文 件 或 jar 文 件 中 加 载 字 节 码 文件 ， 通 过 自 定义 的 ClassLoader， 
0 数据 库 、 绥 存 服务 器 等 其 他 地 方 加 载 字 
市 码 文 件 。 


理解 目 定 义 ClassLoader 有 助 于 我 们 理解 这 些 系统 程序 和 框架 ， 如 
Tomat、JSP、OSGI， 在 业务 需要 的 时 候 ， 也 可 以 借助 自 定 义 
ClassLoader 实 现 动态 灵活 的 功能 。 


下 面 ， 我 们 首先 来 进一步 理解 Java 加 载 类 的 过 程 ， 理 解 类 




















ClassLoader 和 Class.for-Name， 介 绍 一 个 简单 的 应 用 ， 然 后 探讨 如 何 实 
现 自 定 义 ClassLoader， 演示 如 何 利用 它 实现 热 部 团 。 


24.1 类 加 载 的 基本 机 制 和 过 程 


运行 Java 程 序 ， 束 是 执行 java 这 个 命令 ， 指 定 包 含 main 方 法 的 完整 
类 名 ， 以 及 一 个 classpath， 即 类 路 径 。 类 路 径 可 以 有 多 个 ， 对 于 直接 的 
class 文 件 ， 路 径 是 class 文 件 的 根 目 录 ， 对 于 jar 包 ， 路 径 是 jar 包 的 完整 名 
称 〈 包 括 路 径 和 jar 包 名 ) 。 


Java 运 行 时 ， 会 根据 类 的 完全 限定 名 寻找 并 加 载 类 ， 寻 找 的 方式 基 
本 就 是 在 系统 类 和 指定 的 类 路 人 径 中 寻找 ， 如 果 是 class 文 件 的 根 目录 ， 则 
直接 查看 是 侣 有 对 应 的 子 目 录 及 文件 ， 如 果 是 jar 文 件 ， 则 首先 在 内 存 中 
解压 文件 ， 然 后 再 查看 是 否 有 对 应 的 类 。 


负责 加 载 类 的 类 就 是 类 加 载 器 ， 它 的 输入 是 完全 限定 的 类 名 ， 输 出 
是 Class 对 象 。 类 加 载 器 不 是 只 有 一 个 ， 一 般 程 序 运行 时 ， 都 会 有 三 个 
(适用 于 Java 9 之 前 ，Java 9 引入 了 模块 化 ， 基 本 概念 是 类 似 的 ， 但 有 一 
些 变化 ， 限 于 篇 幅 ， 就 不 探讨 了 ) 。 


1) 启动 类 加 载 器 (Bootstrap ClassLoader) : 这 个 加 载 器 是 Java 虚 
拟 机 实现 的 一 部 分 ， 不 是 Java 语 言 实现 的 ， 一 般 是 C++ 实现 的 ， 它 负责 
加 载 Java 的 基础 类 ， 主 要 是 <JAVA_HOME>/ib/rt.jar， 我 们 日 常用 的 
Java 类 库 比 如 String、ArrayList 等 都 位 于 该 包 内 。 


























2) 扩展 类 加 载 器 (Extension ClassLoader) : 这 个 加 载 器 的 实现 类 
是 sun.misc.Laun-cher$ExtClassLoader， 它 负责 加 载 Java 的 一 些 扩 展 类 ， 
一 般 是 <JAVA_HOME>/lib/ext 目 录 中 的 jar 包 。 


3) 应 用 程序 类 加 载 器 (Application ClassLoader) : 这 个 加 载 器 的 
实现 类 是 sun.misc.Launcher$AppClassLoader， 它 负责 加 载 应 用 程序 的 
类 ， 包 括 自 己 写 的 和 引入 的 第 三 方法 类 库 ， 即 所 有 在 类 路 径 中 指定 的 
类 。 

这 三 个 类 加 载 器 有 一 定 的 关系 ， 可 以 认为 是 父子 关系 ，Application 
ClassLoader 的 父亲 是 Extension ClassLoader，Extension 的 父亲 是 Bootstrap 
ClassLoader。 注 意 不 是 父子 继承 关系 ， 而 是 父子 委派 关系 ， 子 
ClassLoader 有 一 个 变量 parent 指 回 父 ClassLoader， 在 子 Class-Loader 加 载 
类 时 ， 一 般 会 首先 通过 父 ClassLoader 加 载 ， 有 具体 来 说 ， 在 加 载 一 个 类 








时 ， 基 本 过 程 是 : 


1) 判断 是 否 已 经 加 载 过 了 ， 加 载 过 了 ， 直 接 返 回 Class 对 象 ， 一 个 
类 只 会 被 一 个 Class-Loader 加 载 一 次 。 


2) 如 果 没 有 被 加 载 ， 先 让 父 ClassLoader 去 加 载 ， 如 果 加 载 成 功 ， 
返回 得 到 的 Class 对 象 。 


3) 在 父 ClassLoader 没 有 加 载 成 功 的 前 提 下 ， 目 己 尝 试 加 载 类 。 


这 个 过 程 一 般 被 称 为 " 双 杀 委派 ”模型 ， 即 优先 让 父 ClassLoader 去 加 
载 。 为 什么 要 先 让 父 ClassLoader 去 加 载 呢 ? 这 样 ， 可 以 避免 Java 类 库 被 
履 盖 的 问题 。 比 如 ， 用 户 程序 也 定义 了 一 个 类 java.lang.String， 通 过 双 
杀 委 派 ，java.lang.String 只 会 被 Bootstrap ClassLoader 加 载 ， 避 免 自 定义 
的 String 履 盖 Java 类 库 的 定义 。 


再 要 了 解 的 是 , “ 双 杀 委 小 ”虽然 是 一 般 模型 ， 但 也 有 一 些 例外 ， 比 





如 : 


1) 目 定义 的 加 载 顺 序 : 尽管 不 被 建议 ， 目 定义 的 ClassLoader 可 以 
不 遵从 “双亲 委派 ”这 个 约定 ， 不 过 ， 即 使 不 遵从 ， 以 java 开 头 的 类 也 不 
能 被 自 定 义 类 加 载 器 加 载 ， 这 是 由 Java 的 安全 机 制 保证 的 ， 以 避免 混 
乱 。 


2) 网 状 加 载 顺 序 : 在 OSGI 框 架 和 Java 9 模块 化 系统 中 ， 类 加 载 器 
之 间 的 关系 是 一 个 网 ， 每 个 模块 有 一 个 类 加 载 器 ， 不 同 模块 之 间 可 能 
依赖 关系 ， 在 一 个 模块 加 载 一 个 类 时 ， 可 能 是 从 自己 模块 加 载 ， 也 可 能 
是 委派 给 其 他 模块 的 类 加 载 器 加 载 。 


3) 父 加 载 器 委派 给 子 加 载 嚣 加载 : 典型 的 例子 有 JNDI 服 务 (Java 
Naming and Directory Interface〉， 它 是 Java 企 业 级 应 用 中 的 一 项 服务 ， 
有 共 体 我 们 就 不 介绍 了 。 


一 个 程序 运行 时 ， 会 创建 一 个 Application ClassLoader， 在 程序 中 用 
到 ClassLoader 的 地 方 ， 如 果 没 有 指定 ， 一 般 用 的 都 是 这 个 ClassLoader， 
所 以 ， 这 个 ClassLoader 也 被 称 为 系统 类 加 载 闫 (System 
ClassLoader) 。 下 和 面 ， 我 们 来 具体 看 下 表示 类 加 载 器 的 类 ClassLoader。 





24.2 ”理解 ClassLoader 


类 ClassLoader 是 一 个 抽象 类 ，Application ClassLoader 和 Extension 
ClassLoader 的 具体 实现 类 分 别 是 sun.misc.Launcher$AppClassLoader 和 
sun.misc.Launcher$ExtClassLoader，Bootstrap ClassLoader 不 是 由 Java 实 


现 的 ， 没 有 对 应 的 类 。 


每 个 Class 对 象 都 有 一 个 方法 ， 可 以 获取 实际 加 载 它 的 ClassLoader， 
方法 是 : 





public ClassLoader getClassLoader() 





ClassLoader 有 一 个 方法 ， 可 以 获取 它 的 父 ClassLoader: 





public final ClassLoader getParent() 





如 果 ClassLoader 是 Bootstrap ClassLoader， 返 回 值 为 null。 比 如 : 





public class ClassLoaderDemo { 
public static void main(String[] args) { 
ClassLoader cl = ClassLoaderDemo.class.getClassLoader(); 
while(cl != null) { 
System.out.printin(cl.getClass().getName()); 
cl = cl.getPparent(); 





} 
System.out.printiln(String.class.getClassLoader()); 
} 
} 
-AN 
输出 为 : 





sun.misc.Launcher$AppClassLoader 
sun.misc.Launcher$ExtClassLoader 
null 





ClassLoader 有 一 个 静态 方法 ， 可 以 获取 默认 的 系统 类 加 载 器 : 





public static ClassLoader getSystemClassLoader() 





ClassLoader 中 有 一 个 主要 方法 ， 用 于 加 载 类 : 





public Class<?> loadClass(String name) throws ClassNotFoundException 





比如 : 





ClassLoader cl = ClassLoader.getSystemClassLoader(); 

try { 
Class<?> cls = cl.loadCclass("java.util.ArrayList"),; 
ClassLoader actualLoader = cls.getcClassLoader(); 
System.out.println(actualLoader); 

} catch (ClassNotFoundException e) { 
e.printStackTrace( ); 





需要 说 明 的 是 ， 由 于 委派 机 制 ，Class 的 getClassLoader 方 法 返回 的 
不 = 定 是 调用 load-Class 的 ClassLoader， 比 如 ， 上 面 代 码 中 ， 
java.util.ArrayList 实 际 由 BootStrap ClassLoader 加 载 ， 所 以 返回 值 就 是 
null。 


在 反射 一 章 ， 我 们 介绍 过 Class 的 两 个 静态 方法 forName: 





public static Class<?> forName(String className) 
public static Class<?> forName(String name, 
boolean initialize, ClassLoader loader) 





第 一 个 方法 使 用 系统 类 加 载 器 加 载 ， 第 二 个 方法 指定 ClassLoader， 
参数 initialize 表 示 加 载 后 是 否 执行 类 的 初始 化 代码 〈 如 static 语 句 块 ) ， 
没有 指定 默认 为 true。 


ClassLoader 的 loadClass 方 法 与 Class 的 forName 方 法 都 可 以 加 载 类 
它们 有 什么 不 同 呢 ? 基本 是 一 样 的 ， 不 过 ，ClassLoader 的 loadClass 不 会 
执行 类 的 初始 化 代码 ， 看 个 例子 : 








public class CLInitDemo { 
public static class Hello { 
static { 


System.out.printin("hello"); 


} 
}; 
public static void main(String[] args) { 
ClassLoader cl = ClassLoader.getSystemClassLoader(); 
String className = CLInitDemo.class.getName() + "$Hello"; 
try { 
Class<?> cls = cl.loadClass(className); 
} catch (ClassNotFoundException e) { 
e.printSstackTrace(); 
} 





使 用 ClassLoader 加 载 静态 内 部 类 Hello，Hello 有 一 个 static 语 句 块 ， 
输出 "hello"， 运 行 该 程序 ， 类 被 加 载 了 ， 但 没有 任何 输出 ， 即 static 语 名 
块 没有 被 执行 。 如 果 将 loadClass 的 语句 换 为 : 








Class<?> cls = Class.forName(className); 





则 static 语 句 块 会 被 执行 ， 屏幕 将 输出 "hello"。 
我 们 来 看 下 ClassLoader 的 loadClass 代 码 ， 以 进一步 理解 其 行为 : 





public Class<?> loadClass(String name) throws ClassNotFoundException { 
return loadClass(name, false); 
} 





它 调 用 了 为 一 个 loadClass 方 法 ， 其 主要 代码 为 省略 了 一 些 代 码 ， 
加 了 注释 ， 以 便于 理解 ) : 





protected Class<?> loadClass(String name, boolean resolve) 
throws ClassNotFoundException { 
synchronized (getClassLoadingLock(name)) { 
// 首 先 ， 检 查 类 是 否 已 经 被 加 载 了 
Class c = findLoadedClass(name); 
if(c == null) { 
// 没 被 加 载 ， 先 委派 父 ClassLoader 或 BootStrap ClassLoader 去 加 载 
try { 
if(parent != null) { 
// 委 派 父 ClassLoader，resolve 参 数 固定 为 false 
c = parent.loadClass(name, false); 
} else { 
c = findBootstrapClassOrNull(name); 




















} catch (ClassNotFoundException e) { 
// 没 找到 ， 捕 获 异常 ， 以 便 尝试 自己 加 载 























ull) { 
,去 加 载 ，findClass 才 是 当前 ClassLoader 的 真正 加 载 方法 
= findclass(name ) ; 





if(c == nN 
[ 


















































if(resolve) { 
// 链 接 ， 执 行 static 语 句 块 
resolveClass(c); 





return c; 
} 
} 





参数 resolve 类 似 Class.forName 中 的 参数 initialize， 可 以 看 出 ， 其 默 
认 值 为 false， 即 使 通过 自 定义 ClassLoader 重 写 loadClass， 设 置 resolve 为 
true， 它 调用 父 ClassLoader 的 时 候 ， 传 递 的 也 是 固定 的 false。findClass 
是 一 个 protected 方 法 ， 类 ClassLoader 的 默认 实现 就 是 抛 出 
ClassNotFoundException， 子 类 应 该 重 写 该 方法 ， 实 现 自己 的 加 载 逻 
辑 ， 后 文 我 们 会 给 出 具体 例子 。 





24.3 ”类 加 载 的 应 用 : 可 配置 的 集 略 


可 以 通过 ClassLoader 的 loadClass 或 Class.forName 自 己 加 载 类 ， 但 什 
么 情况 需要 上 自己 加 载 类 呢 ? 很 多 应 用 使 用 面 同 接口 的 编程 ， 接 口 具体 的 
实现 类 可 能 有 很 多 ， 适 用 于 不 同 的 场合 ， 具 体 使 用 哪个 实现 类 在 配置 文 
件 中 配置 ， 通 过 更 改 配 置 ， 不 用 改变 代码 ， 就 可 以 改变 程序 的 行为 ， 在 
设计 模式 中 ， 这 是 一 种 策略 模式 。 我 们 看 个 简单 的 示例 ， 定 义 一 个 服 
务 接口 IService: 




















public interface IService { 
public void action(); 








客户 端 通过 该 接口 访问 其 方法 ， 怎 么 获得 IService 实 例 呢 ? 查看 配 
时 文件 ， 根 据 配置 的 实现 类 ， 自 己 加 载 ， 使 用 反射 创建 实例 对 象 ， 示 全 
尺码 为 : 











public class ConfigurableStrategyDemo { 
public static IService createService() { 


try { 
Properties prop = new Properties(); 
String fileName = "data/c87/config.properties"; 


prop.load(new FileInputStream(fileName)); 
String className = prop.getProperty("service"); 
Class<?> cls = Class.forName(className); 
return (IService) cls,newInstance() ; 

} catch (Exception e) { 
throw new RuntimeException(e); 

} 


public static void main(String[] args) { 
IService service = createService(); 
service.action(); 
} 
} 





config.properties 的 内 容 示 例 为 : 





service=shuo.1laoma.dynamic.c87.ServiceB 





代码 比较 简单 ， 就 不 壮 述 了 。 完 整 代 码 可 参 
看 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c87 下 。 


24.4 ”月 定义 ClassLoader 


Java 类 加 载 机 制 的 强大 之 处 在 于 ， 我 们 可 以 创建 目 定义 的 
ClassLoader， 自 定义 Class-Loader 是 Tomcat 实 现 应 用 隔离 、 支 持 JSP、 
OSGI 实 现 动态 模块 化 的 基础 。 


怎么 自 定义 呢 ? 一 般 而 言 ， 继 承 类 ClassLoader， 重 写 findClass 就 可 
以 了 。 怎 么 实现 findClass 呢 ? 使 用 目 己 的 逻辑 寻找 class 文 件 字 节 码 的 字 
节 形 式 ， 找 到 后 ， 使 用 如 下 方法 转换 为 Class 对 象 : 





protected final Class<?> defineClass(String name, byte[] b, int off, int len) 








name 表 示 类 名 ，b 是 存放 字 节 人 码 数据 的 字 市 数组 ， 有 效 数 据 从 off 开 
台 ， 长 度 为 lan。 看 个 例子 : 





public class MyClassLoader extends ClassLoader { 
private static final String BASE DIR = "data/c87/"; 
Q@Override 
protected Class<?> findClass(String name) throws ClassNotFoundException { 
String fileName = name.replaceAll(™\\.", "/"); 
fileName = BASE DIR + fileName + ".class"; 
try { 
byte[] bytes = BinaryFileUtils.readFileToByteArray(fileName); 
return defineClass(name, bytes, 0, bytes.1length); 
} catch (IOException ex) { 
throw new ClassNotFoundException("failed to load class " + name, ex); 
} 
} 
} 





MyClassLoader 从 BASE_DIR 下 的 路 径 中 加 载 类 ， 它 使 用 了 我 们 在 第 
13 章 介绍 的 readFileToByteArray 方 法 读 取 文件 ， 转 换 为 byte 数 组 。 
MyClassLoader 没 有 指定 父 Class-Loader， 默 认 是 系统 类 加 载 器 ， 即 
ClassLoader.getSystemClassLoader 〈) 的 返回 值 ， 不 过 ，Class-Loader 有 
一 个 可 重 写 的 构造 方法 ， 可 以 指定 父 ClassLoader: 





protected ClassLoader(ClassLoader parent) 





MyClassLoader 有 什么 用 呢 ?” 将 BASE_DIR 加 人 到 classpath 中 不 就 行 
了 ， 确 实 可 以 ， 这 里 主要 是 演示 基本 用 法 ， 实 际 中 ， 可 以 从 Web 服 务 
数据 库 或 缓存 服务 器 获取 bytes 数 组 ， 这 就 不 是 系统 类 加 载 器 能 做 到 
J。 


不 过 ， 不 把 BASE_DIR 放 到 classpath 中 ， 而 是 使 用 MyClassLoader 加 
载 ， 还 有 一 个 很 大 的 好 处 ， 那 就 是 可 以 创建 多 个 MyClassLoader， 对 同 
一 个 类 ， 每 个 MyClassLoader 都 可 以 加 载 一 次 ， 得 到 同一 个 类 的 不 同 
Class 对 象 ， 比 如 : 





MyClassLoader cl1 = new MyClassLoader(); 
String className = "shuo.laoma.dynamic.c87.HelloService",; 
Class<?> class1 = cl1.loadClass(className); 
MyClassLoader cl2 = new MyClassLoader(); 
Class<?> class2 = cl2.1loadClass(className); 
if(class1 != class2) 
System.out.printiln("different classes"); 
} 





cl1 和 cl2 是 两 个 不 同 的 ClassLoader，class1 和 class2 对 应 的 类 名 一 
样 ， 但 它们 是 不 同 的 对 象 。 


但 ， 这 到 撒 有 什么 用 呢 ? 


1) 可 以 实现 隔离 。 一 个 复杂 的 程序 ， 内 部 可 能 按 模 块 组 织 ， 不 同 
模块 可 能 使 用 同一 个 类 ， 但 使 用 的 是 不 同 版 本 ， 如 果 使 用 同一 个 类 加 载 
器 ， 它 们 是 无 法 共存 的 ， 不 同 模块 使 用 不 同 的 类 加 载 嚣 就 可 以 实现 隔 
离 ，Tomcat 使 用 它 隔 离 不 同 的 Web 应 用 ，OSGI 使 用 它 隔 离 不 同 模块 。 


2) 可 以 实现 热 部 署 。 使 用 同一 个 ClassLoader， 类 只 会 被 加 载 一 
次 ， 加 载 后 ， 即 使 class 文 件 已 经 变 了 ， 再 次 加 载 ， 得 到 的 也 还 是 原来 的 
Class 对 象 ， 而 使 用 MyClassLoader， 则 可 以 先 创建 一 个 新 的 
1 再 用 它 加 载 Class， 得 到 的 Class 对 象 就 是 新 的 ， 从 而 实现 
动态 更 新 。 


下 面 ， 我 们 来 具体 看 热 部 普 的 示例 。 











24.5 ” 自 定 义 ClassLoader 的 应 用 : 热 部 署 


所 谓 热 部 普 ， 融 是 在 不 重 局 应 用 的 情况 下 ， 当 类 的 定义 即 字 节 人 码 文 
件 修 改 后 ， 能 够 替换 该 Class 创 建 的 对 象 ， 怎 么 做 到 这 一 点 呢 ? 我 们 利用 
MyClassLoader， 看 个 简单 的 示例 。 


我 们 使 用 面 同 接口 的 编程 ， 定 义 一 个 接口 I[HelloService: 











public interface IHelloService { 
public void sayHello(); 
} 





实现 类 是 shuo.laoma.dynamic.c87.HelloImpl，class 文 件 放 到 
MyClassLoader 的 加 载 目 录 中 。 


演示 类 是 HotDeployDemo， 它 定义 了 以 下 静态 变量 : 








private static final String CLASS NAME = "shuo.laoma.dynamic.c87.HelloImpl"; 
private static final String FILE NAME = "data/c87/" 

+CLASS_ NAME .replaceAll("™\\.", "/")+".class"; 
private static volatile IHelloService helloService; 





CLASS_NAME 表 示 实 现 类 名 称 ，FILE_NAME 是 具体 的 class 文 件 路 
径 ，helloService 是 IHelloService 实 例 。 


当 CLASS_NAME 代 表 的 类 字 节 码 改变 后 ， 我 们 希望 重新 创建 
helloService， 反 映 最 新 的 代码 ， 怎 么 做 昵 ? 先 看 用 户 端 获 取 
IHelloService 的 方法 : 





public static IHelloService getHelloService() { 
if(helloService != null) { 
return helloService; 


synchronized (HotDeployDemo.class) { 
if(helloSservice == null) { 
helloService = createHelloService(); 


} 
return helloService; 


} 





这 是 一 个 单 例 模式 ，createHelloService() 的 代码 为 : 





private static IHelloService createHelloService() { 
try { 
MyClassLoader cl = new MyClassLoader(); 
Class<?> cls = cl.loadClass(CLASS_ NAME); 
if(cls != null) { 
return (IHelloService) cls.newInstance(); 


} 
} catch (Exception e) { 
e.printStackTrace(); 


return null; 








它 使 用 MyClassLoader 加 载 类 ， 并 利用 反射 创建 实例 ， 它 假定 实现 
类 有 一 个 public 无 参 构造 方法 。 


在 调用 IHelloService 的 方法 时 ， 客 户 端 总 是 先 通 过 getHelloService 获 
取 实 例 对 象 ， 我 们 模拟 一 个 客户 端 线程 ， 它 不 停 地 获取 IHelloService 对 
象 ， 并 调用 其 方法 ， 然后 睡眠 1 秒 钟 > 其 代码 为 : 








public static void client() { 
Thread t = new Thread() { 
@Override 
public void run() { 
try { 
while (true) 区 
IHelloService helloService = getHelloService(); 
helloService,.sayHello( ); 
Thread. sleep(1000); 


} catch (InterruptedException e) { 
+ 
} 


/ 
t.start(); 





怎么 知道 类 的 class 文 件 发 生 了 变化 ， 并 重新 创建 helloService 对 象 
呢 ? 我 们 使 用 一 个 单独 的 线程 模拟 这 一 过 程 ， 代 码 为 : 





public static void monitor() { 
Thread t = new Thread() { 
private long lastModified = new File(FILE NAME).lastModified(); 
@Override 


public void run() { 
try { 
while(true) { 

Thread.sleep(100); 

long now = new File(FILE NAME).JlastModified(); 

if(now != lastModified) { 
JastModified = now; 
reloadHelloService( ); 


} 
} catch (InterruptedException e) { 
} 
} 


}; 
t.start(); 





我 们 使 用 文件 的 最 后 修改 时 间 来 跟踪 文件 是 否 发 生 了 变化 ， 当 文件 
修改 后 ， 调 用 reloadHelloService 〈) 来 重新 加 载 ， 其 代码 为 : 





public static void reloadHelloService() { 
helloService = createHelloService(); 


} 





就 是 利用 MyClassLoader 重 新 创建 HelloService， 创 建 后 ， 赋 值 给 
helloService， 这 样 ， 下 次 getHelloService() 获取 到 的 就 是 最 新 的 了 。 


在 主 程序 中 启动 dient 和 monitor 线 程 ， 代 码 为 : 





public static void main(String[] args) { 
monitor(); 
client(); 





在 运行 过 程 中 ， 蔡 换 HelloImpl.class， 可 以 看 到 行为 会 变化 ， 为 便 
于 演示 ， 我 们 在 data/c87/shuo/laoma/dynamic/c87/ 目 录 下 准备 了 两 个 不 同 
的 实现 类 : HelloImpl_origin.class 和 HelloImpl_revised.class， 在 运行 过 程 
中 蔡 换 ， 会 看 到 输出 不 一 样 ， 如 岁 24-1 所 示 。 


$ cp HelloImp\l_origin.class HelloImpl.class 
$ cp HelloImpl_revised.class HelloImpl.class 
$ cp HelloImpl_origin.class HelloImpl.class 


revised 
revised 





图 24-1 动态 奉 换 实现 类 示例 


使 用 cp 命令 修改 HelloImpl.class， 如 果 其 内 容 与 
HelloImpl_origin.class 一 样 ， 输 出 为 "hello"; 如 果 与 
HelloImpl_revised.class 一 样 ， 输 出 为 "hello revised"。 


完整 的 代码 和 数据 在 github 上 ， 地 址 
为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c87 下 。 


本 章 介 绍 了 Java 中 的 类 加 载 机 制 ， 包 括 Java 加 载 类 的 基本 过 程 ， 类 
ClassLoader 的 用 法 ， 以 及 如 何 创建 目 定 义 的 ClassLoader， 探 讨 了 两 个 简 
单 应 用 示例 ， 一 个 通过 动态 加 载 实 现 了 可 配置 的 策略 ， 男 一 个 通过 自 定 
义 ClassLoader 实 现 了 热 部 署 。 


需要 说 明 的 是 ，Java 9 引入 了 模块 的 概念 。 在 模块 化 系统 中 ， 类 加 
载 的 过 程 有 一 些 变 化 ， 扩 展 类 的 目录 被 删除 挥 了 ， 原 来 的 扩展 类 加 载 右 
没有 了 ， 增 加 了 一 个 平台 类 加 载 器 (Platform Class Loader) ， 角 色 类 似 
于 扩展 类 加 载 器 ， 它 分 担 了 一 部 分 启动 类 加 载 器 的 职责 ， 男 外 ， 加 载 的 
顺序 也 有 一 些 变化 ， 限 于 篇 幅 ， 我 们 束 不 探讨 了 。 


从 第 21 章 到 本 章 ， 我 们 探讨 了 Java 中 的 多 个 动态 特性 ， 包 括 反 射 、 
注解 、 动 态 代 理 和 类 加 载 器 ， 作 为 应 用 程序 员 ， 大 部 分 用 得 都 比较 少 ， 
用 得 较 多 的 束 是 使 用 框 染 和 库 提供 的 各 种 注解 了 ， 但 这 些 特性 大 量 应 用 














于 各 种 系统 程序 、 框 染 和 库 中 ， 理 解 这 些 特性 有 助 于 我 们 更 好 地 理解 它 
们 ， 也 可 以 在 需要 的 时 候 自 己 实现 动态 、 通 用 、 灵 活 的 功能 。 


在 注解 一 章 ， 我 们 提 到 ， 注 解 是 一 种 声明 式 编程 风格 ， 它 提高 
Java 语 言 的 表达 能 力 ， 日 常 编程 中 一 种 常见 的 需求 是 文本 处 理 ， 在 计算 
机 科学 中 ， 有 一 种 技术 大 大 提高 了 文本 处 理 的 表达 能 力 ， 那 就 是 正则 表 
ns A 
门下 一 章 探讨 。 














第 25 章 ”正则 表达 式 


前 面 章节 ， 我 们 提 到 了 正则 表达 式 ， 它 提升 了 文本 处 理 的 表达 能 
力 ， 本 章 就 来 讨论 正则 表达 式 ， 它 是 什么 ? 有 什么 用 ? 各 种 特殊 字符 都 
是 什么 含义 ? 如何 用 Java 借 助 正则 表达 式 处 理 文本 ?都 有 哪些 常用 正则 
表达 式 ? 我 们 分 为 4 小 节 进 行 介绍 : 25.1 节 先 简要 介绍 正则 表达 式 的 语 
法 ;25.2 节 介绍 相关 的 Java API，25.3 节 利用 Java API 实 现 一 个 简单 的 模 
板 引 擎 ，25.4 节 讨论 和 分 析 一 些 常 用 的 正则 表达 式 。 


25.1 语法 


正则 表达 式 是 一 串 字 符 ， 它 描述 了 一 个 文本 模式 ， 利 用 它 可 以 方便 
地 处 理 文 本 ， 包 括 文本 的 查找 、 蔡 换 、 验 证 、 切 分 等 。 正 则 表达 式 中 的 
字符 有 两 类 : 一 类 是 普通 字符 ， 就 是 匹配 字符 本 身 ， 男 一 类 是 元 字符 ， 
0 
.6 

正则 表达 式 有 一 个 比较 长 的 历史 ， 各 种 与 文本 处 理 有 关 的 工具 、 编 
辑 锅 和 系统 都 文 持 正 则 表达 式 ， 大 部 分 编程 语言 也 都 支持 正则 表达 式 。 
虽然 都 叫 正 则 表达 式 ， 但 由 于 历史 原因 ， 不 同 语言 、 系 统 和 工具 的 语法 
不 太一 样 ， 本 书 主要 针对 Java 语 言 ， 其 他 语言 可 能 有 所 差别 。 


下 面 ， 我 们 就 来 简要 介绍 正则 表达 式 的 语法 ， 我 们 先 分 为 以 下 部 分 

















单个 字符 ， 


特殊 边界 匹配 ; 

:环视 边界 匹配 。 

最 后 针对 转 义 、 匹 配 模式 和 各 种 语法 进行 总 结 。 
1. 单 个 字符 

大 部 分 的 单个 字符 就 是 用 字符 本 身 表 示 的 ， 比 如 字 
符 '0'、'3'、'a'、' 马 ' 等 ， 但 有 一 些 单个 字符 使 用 多 个 字符 表示 ， 这 些 字符 
都 以 斜 杠 N\ 开 头 ， 比 如 : 


1) 特殊 字符 ， 比如 tab 字符 \、 换 行 符 m'、 回 车 符 \ 等 











2) 八进制 表示 的 字符 ， 以 \ 开 头 ， 后 跟 1 一 3 位 数字 ， 比 如 \0141， 
对 应 的 是 ASCII 编 码 为 97 的 字符 ， 即 字符 'a。 


3) 十 六 进 制 表示 的 字符 ， 以 \x 开 头 ， 后 跟 两 位 字符 ， 比 如 \x6A， 
对 应 的 是 ASCII 编 码 为 106 的 字符 ， 即 字符 小 。 


4) Unicode 编 号 表示 的 字符 ， 以 ua 开头 ， 后 跟 4 位 字符 ， 比 如 
\u9A6C， 表 示 的 是 中 文字 符 ' 马 '， 这 只 能 表示 编号 在 0xXFFFF 以 下 的 字 
符 ， 如 果 超 出 0XFFFF， 使 用 \x{...} 形 式 ， 比 如 \x{1f48e}。 


5) 和 斜 杠 \ 本 身 ， 斜 杠 \ 是 一 个 元 字符 ， 如 果 要 匹配 它 自身 ， 使 用 两 
个 冬 杠 表示 ， 即 入。 


6) 元 字符 不 号 ， 除了 N， 正 则 表达 式 中 还 有 很 多 元 字符 ， 比 如 .、 
人 等 ， 要 匹配 这 些 元 字符 上 自身， 需要 在 前 面 加 转 义 字符 N\， 比 
Iu 
2. 字 符 组 

字符 组 有 多 种 ， 包括 任意 字符 、 多 个 指定 字符 之 一 、 字 符 区 间 、 排 
除 型 字符 组 、 预 定义 的 字符 组 等 ， 下 面具 体 介绍 。 


氮 号 字符 "是 一 个 元 字符 ， 默 认 模 式 下 ， 筷 匹配 除了 换行 符 以 外 的 
任意 字符 ， 比 如 正则 表达 式 : 




















既 匹 配 字符 串 "abf"， 也 匹配 "acf"。 可 以 指定 另外 一 种 匹配 模式 ， 
般 称 为 单行 匹配 模式 或 者 点 号 匹配 模式 ， 在 此 模式 下 ，'… 匹 配 任意 字 
符 ， 包 括 换 行 符 。 可 以 有 两 种 方式 指定 匹配 模式 : 一 种 是 在 正则 表达 式 
中 ， 以 (? s) 开头 ，s 表 示 single line， 即 单行 匹配 模式 。 比 如 : 








(?s)a.f 








男 外 一 种 是 在 程序 中 指定 ， 在 Java 中 ， 对 应 的 模式 常量 是 
Pattern.DOTALL， 下 节 我 们 再 介绍 Java API。 


在 单个 字符 和 任意 字符 之 间 ， 有 一 个 字符 组 的 概念 ， 匹 配 组 中 的 任 
意 一 个 字符 ， 用 中 括号 0 表示 ， 比 如 : 





[abcd] 





匹配 a、b、c、d 中 的 任意 一 个 字符 。 





[9123456789] 





匹配 任意 一 个 数字 字符 。 
为 方便 表示 连续 的 多 个 字符 ， 字 符 组 中 可 以 使 用 连 字符 ， 比 如 : 








[9-9] 
[a-z] 





可 以 有 多 个 连续 空间 ， 可 以 有 其 他 普通 字符 ， 比 如 : 





[0-9a-zA-Z_] 





在 字符 组 中 ，'- 是 一 个 元 字符 ， 如 果 要 匹配 它 上 自身 ， 可 以 使 用 转 
义 ， 即 \-'， 或 者 把 它 放 在 字符 组 的 最 前 面 ， 比 如 : 





[-0-9] 





字符 组 支持 排除 的 概念 ， 在 [后 紧 跟 一 个 字符 和 ^， 比 如 : 





[^abcd] 








表示 匹配 除了 a，b，c，d 以 外 的 任意 一 个 字符 。 





[^0-9] 





表示 匹配 一 个 非 数 字 字 符 。 


排除 不 是 不 能 匹配 ， 而 是 匹配 一 个 指定 字符 组 以 外 的 字符 ， 要 表达 
不 能 匹配 的 含义 ， 需 要 使 用 后 文 介 绍 的 环视 语法 。^ 只 有 在 字符 组 的 开 
头 才 是 元 字符 ， 如 果 不 在 开头 ， 就 是 普通 字符 ， 匹 配 它 自 叉 ， 比 如 : 








[a^b] 





就 是 匹配 字符 a， 作 或 b。 

在 字符 组 中 ， 除 了 ^、-、 口 、\ 外 ， 其 他 在 字符 组 外 的 元 字符 不 再 具 
备 特殊 含义 ， 变 成 了 普通 字符 ， 比 如 字符 '" 和 ' 湾 '，[.*] 就 是 匹配 .或 
2 

有 一 些 特殊 的 以 \ 开 头 的 字符 ， 表 示 一 些 预定 义 的 字符 组 ， 比 如 : 

\d: d 表 示 digit， 匹 配 一 个 数字 字符 ， 等 同 于 [0-9]。 

\w: w 表 示 word， 匹 配 一 个 单词 字符 ， 等 同 于 [a-zA-Z_0-9]。 

\S: Ss 表 示 space， 匹 配 一 个 空白 字符 ， 等 同 于 [\tn\x0B\fV]。 

它们 都 有 对 应 的 排除 型 字符 组 ， 用 大 写 表 示 ， 即 : 

\D: 匹配 一 个 非 数 字 字 符 ， 即 [Ad]。 

\W: 匹配 一 个 非 单词 字符 ， 即 [A\w]。 

\S: 匹配 一 个 非 空 白字 符 ， 即 [As]。 

还 有 一 类 字符 组 ， 称 为 POSIX 字 符 组 ， 它 们 是 POSIX 标 准 定 义 的 一 
些 字符 组 ， 在 Java 中 ， 这 些 字符 组 的 形式 是 \p{...}。POSIX 字 符 组 比较 
多 ， 我 们 就 不 介绍 了 。 
3. 量 词 


量词 指 的 是 指定 出 现 次 数 的 元 字符 ， 有 三 个 常见 的 元 字符 :+、 
二 


米 


] 


1) +: 表示 前 面 字符 的 一 次 或 多 次 出 现 ， 比 如 正则 表达 式 ab+c， 既 
能 匹配 abc， 也 能 匹配 abbc， 或 abbbc。 


2) *: 表示 前 面 字 符 的 零 次 或 多 次 出 现 ， 比 如 正则 表达 式 ab*c， 既 
能 匹配 abc， 也 能 匹配 ac， 或 abbbc。 


3) ? : 表示 前 面 字 符 可 能 出 现 ， 也 可 能 不 出 现 ， 比 如 正则 表达 式 
ab? c， 既 能 匹配 abc， 也 能 匹配 ac， 但 不 能 匹配 abbc。 

更 为 通用 的 表示 出 现 次 数 的 语法 是 tm，n}， 出 现 次 数 从 m 到 n， 包 
括 m 和 mn， 如 果 n 没 有 限制 ， 可 以 省 略 ， 如 果 m 和 nm 一样 ， 可 以 写 为 {m}， 
比如 : 


:ab{1，10}c: b 可 以 出 现 1 次 到 10 次 。 





“ab{3}c: b 必 须 出 现 三 次 ， 即 只 能 匹配 abbbc。 
:ab{1，}c: 与 ab+c 一 样 。 

ab{0，}c: 与 ab*c 一 样 。 

-ab{0，1}c: 与 ab? c 一 样 。 


需要 注意 的 是 ， 语 法 必须 是 严格 的 fm， 品 形式， 去 号 左右 不 能 有 








? 、*、+、{ 是 元 字符 ， 如 果 要 匹配 这 些 字 符 本 身 ， 需 要 使 用 \ 转 
比如 : 





a\*b 





匹配 字符 串 "a*b"。 这 些 量词 出 现在 字符 组 中 时 ， 不 是 元 字符 ， 比 
如 : 





[?*+{] 





就 是 匹配 其 中 一 个 字符 本 身 。 


关于 量词 ， 它 们 的 默认 匹配 是 贫 杨 的 ， 什 么 意思 呢 ? 看 个 例子 ， 
正则 表达 陈 是 : 





<a>.*</a> 





如 果 要 处 理 的 字符 串 是 : 





<a>first</a><a>second</a> 








目的 是 想得到 两 个 匹配 ， 一 个 匹配 : 





<a>first</a> 








<a>second</a> 





但 默认 情况 下 ， 得 到 的 结果 却 只 有 一 个 匹配 ， 匹 配 所 有 内 容 。 


这 是 因为 ,* 可 以 匹配 第 一 个 <a> 和 最 后 一 个 </a> 之 间 的 所 有 字符 ， 只 
要 能 匹配 ，.* 就 尽量 往 后 匹配 ， 它 是 贪 焚 的 。 如 果 希 望 在 碰 到 第 一 个 匹 
配 时 就 停止 呢 ? 应 该 使 用 懒惰 量词 ， 在 量词 的 后 面 加 一 个 符号 '? '， 针 
对 上 例 ， 将 表达 式 改 为 : 





<a>.*?</a> 





就 能 得 到 期 望 的 结果 。 所 有 旱 词 都 有 对 应 的 懒惰 形式 ， 比如 : 


X? ? 、X*? 、X+? 、X{m，n}? 等 。 
4. 分 组 
表达 式 可 以 用 括号 〈) 括 起 来 ， 表 示 一 个 分 组 ， 比 如 a (bc) d,， bc 


束 是 一 个 分 组 。 分 组 可 以 嵌 套 ， 比 如 ade (fg) ) 。 分 组 默认 都 有 一 
个 编号， 按照 括号 的 出 现 顺 序 ， 从 1 开始 ， 从 左 到 右 依 次 递增 ， 比 如 表 


达 式 : 





a(bc)((de)(fg)) 








字符 串 abcdefg 匹 配 这 个 表达 式 ， 第 1 个 分 组 为 bc， 第 2 个 为 defg， 第 
3 个 为 de， 第 4 个 为 fg。 分 组 0 是 一 个 特殊 分 组 ， 内 容 是 整个 匹配 的 字符 
串 ， 这 里 是 abcdefg。 


分 组 匹配 的 子 字 符 串 可 以 在 后 续 访 问 ， 好 像 被 捕获 了 一 样 ， 所 以 默 
认 分 组 称 为 捕获 分 组 。 关于 如 何在 Java 中 访问 和 使 用 捕获 分 组 ， 我 们 下 
他 再 介绍 。 


可 以 对 分 组 使 用 量词 ， 表 示 分 组 的 出 现 次 数 ， 比 如 a (bc) +d， 表 
示 bc 出 现 一 次 或 多 次 。 


中 括号 口 表示 匹配 其 中 的 一 个 字符 ， 括 号 〈) 和 元 字符 一起， 可 
以 表示 匹配 其 中 的 一 个 子 表达 式 ， 比 如 : 











(http|ftp|file) 





匹配 http 或 ftp 或 file。 
需要 注意 区 分 | 各]，| 用 于 [中 不 再 有 特殊 合 义 ， 比 如 : 





[alb] 





它 的 含义 不 是 匹配 a 或 b， 而 是 a 或 | 或 b。 


在 正则 表达 式 中 ， 可 以 使 用 和 斜 杠 \ 加 分 组 编写 引用 之 前 匹配 的 分 
组 ， 这 称 为 回溯 引用 ， 比 如 : 





<(\w+)>(.*)</\1> 





NM 匹配 之 前 的 第 一 个 分 组 Nw+〉， 这 个 表达 式 可 以 匹配 类 似 如 下 


字符 串 : 


<title>bc</title> 





这 里 ， 第 一 个 分 组 是 "title"。 


使 用 数字 引用 分 组 ， 可 能 容易 出 现 混 乱 ， 可 以 对 分 组 进行 命名 ， 通 
过 名 字 引 用 之 前 的 分 组 ， 对 分 组 命名 的 语法 是 〈? <name>X) ， 引 用 分 
组 的 语法 是 \k<name>， 比 如 ， 上 面 的 例子 可 以 写 为 : 





<(?<tag>\w+)>(.*)</\k<tag>> 





默认 分 组 都 称 为 捕获 分 组 ， 即 分 组 匹配 的 内 容 被 捕获 了 ， 可 以 在 后 
续 被 引用 。 实 现 捕获 分 组 有 一 定 的 成 本 ， 为 了 提高 性 能 ， 如 果 分 组 后 续 
不 需要 被 引用 ， 可 以 改 为 非 捕获 分 组 ， 语 法 是 〈? : …) ， 比 如 : 








(?:abc|def) 





5. 特 殊 边 界 匹 配 


在 正则 表达 式 中 ， 除 了 可 以 指定 字符 需 满 足 什 么 条 件 ， 还 可 以 指定 
字符 的 边界 需 满 足 什 么 条 件 ， 或 者 说 匹配 特定 的 边界 ， 常 用 的 表示 特殊 
边界 的 元 字符 有 人 和 ^、$、\A、\Z、\z 和 \b。 


默认 情况 下 ， 人 ^ 匹 配 整个 字符 串 的 开始 ，^abc 表 示 整 个 字符 串 必须 
以 abc 开 始 。 


需要 注意 的 是 ^ 的 含义 ， 在 字符 组 中 它 表示 排除 ， 但 在 字符 组 外 ， 
它 匹配 开始 ， 比 如 表达 式 ^A[Aabc]， 表 示 以 一 个 不 是 a、b、c 的 字符 开 


始 。 


默认 情况 下 ，$ 匹 配 整个 字符 串 的 结束 ， 不 过 ， 如 果 整 个 字符 串 以 
换行 符 结束 ，$ 匹 配 的 是 换行 符 之 前 的 边界 ， 比 如 表达 式 abc$， 表 示 整 
个 表达 式 以 abc 结 束 ， 或 者 以 abcvNn 或 abcvn 结 束 。 


以 上 A 和 $ 的 含义 是 默认 模式 下 的 ， 可 以 指定 另外 一 种 匹配 模式 : 多 
行 匹配 模式 ， 在 此 模式 下 ， 会 以 行为 单位 进行 匹配 ，^ 匹 配 的 是 行 开 
始 ，$ 匹 配 的 是 行 结束 ， 比 如 表达 式 是 Aabc$， 字 符 串 是 "abcvnabcNrn'"， 














就 会 有 两 个 匹配 。 


可 以 有 两 种 方式 指定 匹配 模式 。 一 种 是 在 正则 表达 式 中 ， 以 〈? 
mm 表示 multi-line， 即 多 行 匹 配 模式 ， 上 面 的 正则 表达 式 可 以 
与 为 : 





(?m)Aabc$ 





另外 一 种 是 在 程序 中 指定 ， 在 Java 中 ， 对 应 的 模式 常量 是 
Pattern.MULTILINE， 下 节 我 们 再 介绍 Java API。 


需要 说 明 的 是 ， 多 行 模式 和 之 前 介绍 的 单行 模式 容易 混淆 ， 其 实 ， 
它们 之 间 没 有 关系 。 单 行 模式 影响 的 是 字符 "的 匹配 规则 ， 使 得 .可 以 
匹配 换行 待 ， 多 行 模式 影响 的 是 ^ 和 $ 的 匹配 规则 ， 使 得 它们 可 以 匹配 
行 的 开始 和 结束 ， 两 个 模式 可 以 一 起 使 用 。 


\A 与 ^ 类 似 ， 但 不 管 什么 模式 ， 它 匹配 的 总 是 整个 字符 串 的 开始 边 





六 和 \z 与 $ 类 似 ， 但 不 管 什 么 模式 ， 它 们 匹配 的 总 是 整个 字符 串 的 结 
束 边界 。\Z 与 z 的 区 别 是 : 如 条 字符 串 以 换行 符 结 束 ，\Z 与 $ 一 样 ， 匹 配 
的 是 换行 符 之 前 的 边界 ， 而 匹配 的 总 是 结束 边界 。 在 进行 输入 验证 的 
时 候 ， 为 了 确保 输入 最 后 没有 多 余 的 换行 符 ， 可 以 使 用 进行 匹配 。 


Vb 匹 配 的 是 单词 边界 ， 比 如 \bcatb， 匹 配 的 是 完整 的 单词 cat， 它 不 
能 匹配 category。\b 匹 配 的 不 是 一 个 有 具体 的 字符 ， 而 是 一 种 边界 ， 这 种 
边界 满足 一 个 要 求 ， 即 一 边 是 单词 字符 ， 另 一 边 不 是 单词 字符 。 在 Java 
中 ，b 识 别 的 单词 字符 除了 \w， 还 包括 中 文字 符 。 


边界 匹配 可 能 难以 理解 ， 我 们 解释 下 。 边 界 匹 配 不 同 于 字符 匹配 ， 
可 以 认为 ， 在 一 个 字符 串 中 ， 每 个 字符 的 两 边 都 是 边界 ， 而 上 面 介绍 
的 这 些 特殊 字符 ， 匹 配 的 都 不 是 字符 ， 而 是 特定 的 边界 ， 看 个 例子 ， 如 
图 25-1 所 示 。 








‘A vv 
\b \b 


图 25-1 边界 逻 配 示例 


上 面 的 字符 串 是 "a catn"， 我 们 用 粗 线 显 示 出 了 每 个 字符 两 边 的 边 
界 ， 并 且 显 示 出 了 每 个 边界 与 哪些 边界 元 字符 匹配 。 


6. 环 视 边 界 匹 配 


对 于 边界 匹配 ， 除 了 使 用 上 面 介绍 的 边界 元 字符 ， 还 有 一 种 更 为 通 
用 的 方式 ， 那 就 是 环视 。 环 视 的 字面 意思 就 是 左右 看 看 ， 需 要 左右 符合 
一 些 条 件 ， 本 质 上 ， 它 也 是 匹配 边界 ， 对 边界 有 一 些 要 求 ， 这 个 要 求 是 
针对 左边 或 右边 的 字符 串 的 。 根 据 要 求 不 同 ， 分 为 4 种 环视 : 


1) 肯定 顺序 环视 ， 语 法 是 (? =...) ， 要 求 右 边 的 字符 串 匹 配 指定 
的 表达 式 。 比 如 表达 式 abc (? =def) ，(? =def) 在 字符 c 右 面 ， 即 匹 
配 c 右 面 的 边界 。 对 这 个 边界 的 要 求 是 : 它 的 右边 有 def， 比 如 abcdef， 
如 果 没 有 ， 比 如 abcd， 则 不 匹配 。 


2) 否定 顺序 环视 ， 语 法 是 〈? ! ...) ， 要 求 右边 的 字符 串 不 能 
配 指定 的 表达 式 。 比 如 表达 式 s (0? ! ing) ， 匹 配 一 般 的 s， 但 不 匹配 后 
面 有 ing 的 sS。 注 意 : 避免 与 排除 型 字符 组 混 消 ， 比 如 s[Aing]，s[Aing] 匹 
配 的 是 两 个 字符 ， 第 一 个 是 s， 第 二 个 是 i、n、g 以 外 的 任意 一 个 字符 。 


3) 肯定 逆序 环视 ， 语 法 是 〈? <=...) ， 要 求 左 边 的 字符 串 匹 配 指 
定 的 表达 式 。 比 如 表达 式 〈? <=\s) abc， (? <=\s) 在 字符 a 左边 ， 即 
匹配 a 左 边 的 边界 。 对 这 个 边界 的 要 求 是 : 它 的 左边 必须 是 空白 字符 。 


4) 否定 逆序 环视 ， 语 法 是 〈? <! ...) ， 要 求 左边 的 字符 串 不 能 
配 指定 的 表达 式 。 比 如 表达 式 〈? <! \w) cat，(? <! \w) 在 字符 c 左 
边 ， 即 匹配 c 左 边 的 边界 。 对 这 个 边界 的 要 求 是 : 它 的 左边 不 能 是 单词 


























sp A 


子 付 。 


可 以 看 出 ， 环 视 也 使 用 括号 〈) ， 不 过 ， 它 不 是 分 组 ， 不 占用 分 组 
编号 。 


这 些 环视 络 构 也 被 称 为 断言 ， 断 言 的 对 象 是 边界 ， 边 界 不 占用 字 
符 ， 没 有 宽度 ， 所 以 也 被 称 为 零 宽度 断言 。 


顺序 环视 也 可 以 出 现在 左边 ， 比 如 表达 式 : 





(?=.*[A-Z])Nw+ 





这 个 表达 式 是 什么 意思 呢 ? \w+ 匹 配 多 个 单词 字符 ，〈? =.*[A- 
Z]) 匹配 单词 字符 的 左边 界 ， 这 是 一 个 肯定 顺序 环视 。 对 这 个 边界 的 要 
求 是 ， 它 右边 的 字符 串 匹 配 表 达 式 : 





.*[A-Z] 





也 就 是 说 ， 它 右边 至 少 要 有 一 个 大 写字 母 。 
逆序 环视 也 可 以 出 现在 右边 ， 比 如 表达 式 : 








[\Ww.]+(?<!\.) 





Mw.]+ 匹 配 单词 字符 和 字符 "构成 的 字符 串 ， 比 如 "hello.ma"。 (? 
<!\.) 匹配 字符 串 的 右边 界 ， 这 是 一 个 逆序 否定 环视 。 对 这 个 边界 的 要 
求 是 : 它 左边 的 字符 不 能 是 .， 也 就 是 说 ， 如 果 字 符 串 以 .结尾 ， 则 匹 
配 的 字符 串 中 不 能 包括 这 个 ''"。 比 如 ， 如 果 字 符 串 是 "hello.ma."， 则 匹配 
的 子 字符 串 是 "hello.ma"。 


环视 匹配 的 是 一 个 边界 ， 里 面 的 表达 式 是 对 这 个 边界 左边 或 右边 字 
re 
达 式 : 








(?=.*[A-Z])(?=.*[0-9])\w+ 





w+ 的 左边 界 有 两 个 要 求 ，〈? =.*[A-Z]) 要 求 后 面 至 少 有 一 个 大 
写字 母 ，〈? =.*[0-9]) 要 求 后 面 至 少 有 一 位 数字 。 


7. 转 义 与 匹配 模式 

我 们 知道 ， 字 符 \' 表 示 转 义 ， 转 义 有 两 种 。 

1) 把 普通 字符 转 义 ， 使 其 具备 特殊 含义 ， 比 
如 Nt、 、Ad、Nw'、Nb'、AA 等 ， 也 就 是 说 ， 这 个 转 义 把 普通 字符 变 为 
了 元 字符 。 


2) 把 元 字符 转 义 ， 使 其 变 为 普通 字符 ， 比 如 WwW、we、\ '、 
4 


记 住 所 有 的 元 字符 ， 并 在 需要 的 时 候 进 行 转 义 ， 这 是 比较 困难 的 ， 
有 一 个 简单 的 办 法 ， 可 以 将 所 有 元 字符 看 作 普通 字符 ， 束 是 在 开始 处 加 
上 \Q， 在 结束 处 加 上 \E， 比 如 : 








\Q(.*+)\E 





\Q 和 和 \E 之 间 的 所 有 字符 都 会 被 视 为 普通 字符 。 


正则 表达 式 用 字符 串 表示 ， 在 Java 中 ， 字 符 \ 也 是 字符 串 语法 中 的 
元 字符 ， 这 使 得 正则 表达 式 中 的 \， 在 Java 字 符 串 表示 中 ， 要 用 两 个 \， 
即 \N， 而 要 匹配 字符 N\ 本 身 ， 在 Java 字 符 串 表示 中 ， 要 用 4 个 \， 即 NAN 
关于 这 点 ， 下 节 我 们 会 进一步 说 明 。 


前 面 提 到 了 两 种 匹配 模式 ， 还 有 一 种 第 用 的 匹配 模式 ， 就 是 不 区 分 
大 小 写 的 模式 ， 指 定 方式 也 有 两 种 。 一 种 是 在 正则 表达 式 开 头 使 用 〈? 
i) ，i 为 ignore， 比 如 : 











(?i)the 





既 可 以 匹配 the， 也 可 以 匹配 THE， 还 可 以 匹配 The。 匹 配 模式 也 可 
以 在 程序 中 指定 ，Java 中 对 应 的 变量 是 Pattern.CASE_INSENSITIVE。 需 
要 说 明 的 是 ， 匹 配 模式 间 不 是 互 斥 的 关系 ， 它 们 可 以 一 起 使 用 ， 在 正则 
表达 式 中 ， 可 以 指定 多 个 模式 ， 比 如 (? smi) 。 





8. 语 法 总 结 





下 面 ， 我 们 用 表格 的 形式 简要 汇总 下 正则 表达 式 的 语法 ， 如 表 25-1 
到 表 25-6 所 示 。 


表 25-1 单个 字符 语法 





语 法 解 释 
\r \n \t 特殊 字符 \uhhhh 基本 Unicode 字符 ， 如 vu9A6C ( 马 ) 
\On 、\Onn 、\Omnn 八进制 字符 ， 如 \0141 增补 Unicode 字符 ， 如 \x{1f48e} 
\xhh 上 六 进 制 字符 ， 如 \x6A 
忆 w AbH 五 
表 25-2 ”字符 组 语法 
语 法 解 释 


默认 模式 是 换行 符 外 的 任意 字符 ， E 
Se 0 到 9、a 到 z 的 任意 一 个 字符 
行 模式 是 任意 字符 wi 
[abc] a、b、c 中 的 任意 一 个 字符 0 到 9 或 者 连 字 符 - 


[^abec] 、b、c 以 外 的 任意 一 个 字符 : .或 者 *， 没 有 特殊 含义 

















去 
语 法 解 释 

[a-z&&[^de]] a 到 z， 但 不 包括 4 和 e \ [^A\d] 

[[abcl[def]] [abcdef] \W [^\w] 

\d [^\s] 

\w [a-zA-Z_ 0-9] 下 二 POSIX 字符 组 

\s [\t\nm\x0B\f\r] 
语 法 解 释 
x? 、x9? Be re 1 次， 多 一 个 ?的 为 司 x 出 现 生 次 到 n 次 
x x 出现 0 次 或 多 次 x{m,} 、x{m,}? x 册 现 mm 次 以 上 
FE x 出现 1 次 或 多 次 :? : 2 x 出现 正好 n 次 











表 25-4 分 组 语法 










匹配 ab 或 cd 


(httplftplfile) 匹配 http、ftp 或 file 


a(bc)+d 





(w+) 捕获 第 一 
用 该 分 组 


<(w+)>(.#)<A1 


bc 作为 一 个 分 组 出 现 多 次 
个 分 组 ， 


给 


i 分 组 命 
(w+) 匹配 的 


引用 命 


PHD 


(?<name>X) 





\k<name> 


(7?:abcldef) 分 组 但 不 折 


\1 回溯 引 








表 25-5 边界 和 环视 语法 


语 法 解 释 
默认 模式 是 整个 字符 串 的 开始 边界 ， 多 行 模 式 是 行 的 开始 边界 
默认 模式 是 整个 字符 串 的 结束 边界 ， 多 行 模式 是 行 的 结束 边界 ， 如 果 结 尾 
前 的 边界 
\A 总 是 匹配 整个 字符 串 的 开始 边界 
这 总 是 匹配 整个 字符 串 的 结束 边界 ， 如 果 结 尾 是 换行 符 ， 匹 配 换行 符 之 前 
\z 总 是 匹配 整个 字符 串 的 结束 边界 ， 不 管 结尾 是 否 是 换行 符 
\b 匹配 单词 边界 ， 边 界 一 边 是 单词 字符 ， 男 一 边 不 是 
.2 肯定 顺序 环视 ， 匹 配 边 界 ， 该 边界 右边 的 字符 串 匹 配 指定 表达 式 
(2!=.) 否定 顺序 环视 ， 匹 配 边 界 ， 该 边界 右边 的 字符 串 不 能 匹配 指定 表达 式 
5. 肯定 逆序 环视 ,匹配 边 界 ， 该 边界 左边 的 字符 串 匹 配 指定 表达 式 
G22 否定 逆序 坏 视 ， 匹 配 边 界 ， 该 边界 左边 的 字符 串 不 能 匹配 指定 表达 式 


表 25-6 ”匹配 模式 和 转 义 语法 


不 区 分 大 小 写 匹 配 

多 行 模式 , ^ 匹 配 行 开 始 ， 
单行 模式 ，. 匹配 任意 字符 ， 
转 义 元 字符 为 普 


J 


f 通 字符 


$ 匹配 行 结 
包括 换行 符 





在 字符 组 中 ， 
\ 本 身 


\Q 到 \E 之 间 的 











分 组 ， 


(.*)<A\k<tag>> 





he 


比如 <(?<ta g>\w+)>, 


命名 为 了 tag 











比如 <Q<tag>\w+)> 











慎 获 ， 匹 配 abc 或 def 


是 换行 符 ， 为 换行 符 之 


的 边界 


解释 
大 部 分 元 字符 没有 特殊 含义 


> /A 


所 有 字符 视 为 普 


f 通 学 符 


25.2 Java API 





正则 表达 式 相 关 的 类 位 于 包 java.util.regex 下 ， 有 两 个 主要 的 类 ， 一 
个 是 Pattern， 另 一 个 是 Matcher。Pattern 表 示 正 则 表达 式 对 象 ， 它 与 要 处 
理 的 具体 字符 串 无 关 。Matcher 表 示 一 个 匹配 ， 它 将 正则 表达 式 应 用 于 
一 个 具体 字符 串 ， 通 过 它 对 字符 串 进行 处 理 。 


字符 串 类 String 也 是 一 个 重要 的 类 ， 我 们 之 前 专门 介绍 过 String， 其 
中 提 到 ， 它 有 一 些 方法 ， 接 受 的 参数 不 是 普通 的 字符 串 ， 而 是 正则 表达 
式 。 此 外 ， 正 则 表达 式 在 Java 中 是 需要 先 以 字符 串 形式 表示 的 。 


下 面 ， 我 们 先 来 介绍 如 何 表 示 正 则 表达 式 ， 然 后 探讨 如 何 利 用 它 实 
现 一 些 带 见 的 文本 处 理 任务 ， 包 括 切 分 、 验 证 、 碍 找 和 蔡 换 。 


1. 表 示 正 则 表达 式 


正则 表达 式 由 元 字符 和 普通 字符 组 成 ， 字 符 \ 是 一 个 元 字符 ， 要 在 
正则 表达 式 中 表示 \ 本 和 号， 需要 使 用 它 转 义 ， 即 \。 


在 Java 中 ， 没 有 什么 特殊 的 语法 能 直接 表示 正则 表达 式 ， 需 要 用 字 
符 串 表示 ， 而 在 字符 串 中 ，AN 也 是 一 个 元 字符 ， 为 了 在 字符 串 中 表示 正 
则 表达 式 的 N\， 就 需要 使 用 两 个 \， 即 六 ， 而 要 匹配 N 本 身 ， 就 需要 4 
A WW 屁 如 下 表 信 式 : 

















<(\w+)>(.*)</\1> 








对 应 的 字符 串 表 示 就 是 : 





"<(\Nw+)>(,x*)</ 人 ANA1>" 











一 个 简单 规则 是 : 正则 表达 式 中 的 任何 一 个 \， 在 字符 串 中 ， 需 要 
管 换 为 两 个 \， 


字符 串 表 示 的 正则 表达 式 可 以 被 编译 为 一 个 Pattern 对 象 ， 比 如 : 


String regex = "<(\\W+)>(.*)</\\1>"; 
Pattern pattern = Pattern.compile(regex); 





Pattern 是 正则 表达 式 的 面 问 对象 表示 ， 所 谓 编译 ， 简 单 理 解 束 是 将 
字符 串 表 示 为 了 一 个 内 部 结构 ， 这 个 结构 是 一 个 有 穷 上 自动 机 。 关 于 有 
穷 目 动机 的 理论 比较 深入 ， 我 们 就 不 探讨 了 。 


编译 有 一 定 的 成 本 ， 而 且 Pattern 对 象 只 与 正则 表达 式 有 关 ， 与 要 处 
理 的 具体 文本 无 关 ， 它 可 以 安全 地 被 多 线程 共享 ， 所 以 ， 在 使 用 同一 个 
正则 表达 式 处 理 多 个 文本 时 ， 应 该 尽量 重用 同一 个 Pattern 对 象 ， 避 人 免 重 
复 编译 。 


Pattern 的 compile 方 法 接受 一 个 额外 参数 ， 可 以 指定 匹配 模式 : 














public static Pattern compile(String regex, int flags) 








上 节 ， 我 们 介绍 过 三 种 匹配 模式 : 单行 模式 (点 号 模式 ) 、 多 行 模 
式 和 大 小 写 无 关 模 式 ， 它 们 对 应 的 常量 分 别 为 : Pattern.DOTALL、 
Pattern.MULTILINE 和 Pattern.CASE_INSENSI-TIVE， 多 个 模式 可 以 一 起 
使 用 ， 通 过 '' 连 起 来 即 可 ， 如 下 所 示 : 








Pattern.compile(regex, Pattern.CASE_ INSENSITIVE | Pattern.DOTALL) 





还 有 一 个 模式 Pattern.LITERAL， 在 此 模式 下 ， 正 则 表达 式 字 符 串 
中 的 元 字符 将 失去 特殊 含义 ， 被 看 作 普 通 字 符 。Patternx 有 一 个 静态 方 
法 : 








public static String quote(String s) 





quote〈) 的 目的 是 类 似 的 ， 它 将 s 中 的 字符 都 看 作 普通 字符 。 我 们 
在 上 节 介 绍 过 \Q 和 \E，\Q 和 \E 之 间 的 字符 会 被 视 为 普通 字符 。gquote () 
基本 上 就 是 在 字符 串 s 的 前 后 加 了 \Q 和 \E， 比 如 ， 如 果 s 为 "\d{6}"， 则 
quote〈) 的 返回 值 就 是 "\QWNd{6 狼 E"。 


2 切 个 








文本 处 理 的 一 个 弟 见 需求 是 根据 分 阳 符 切 分 字符 串 ， 比 如 在 处 理 
CSV 文 件 时 ， 按 如 号 分 隔 每 个 字段 ， 这 个 需求 听 上 去 很 容易 满足 ， 因 为 
String 类 有 如 下 方法 : 











public String[] split(String regex) 





比如 : 





String str = "abc,def,hello"; 
String[] fields = str.split(","); 





不 过 ， 有 一 些 重 要 的 细节 ， 我 们 需要 注意 。 


split 将 参数 regex 看 作 正 则 表达 式 ， 而 不 是 普通 的 字符 ， 如 果 分 隔 符 
是 元 字符 ， 比 如 .9| () [{A? *H\， 就 需要 转 义 。 比 如 按 点 号 分隔， 需要 
写 为 : 





String[] fields = str.split("\\."); 








如 果 分 隔 符 是 用 户 指定 的 ， 程 序 事先 不 知道 ， 可 以 通过 
Pattern.quote 〈) 将 其 看 作 普 通 字 符 串 。 


既然 是 正则 表达 式 ， 分 隔 符 就 不 一 定 是 一 个 字符 ， 比 如 ， 可 以 将 一 
个 或 多 个 空白 字符 或 点 号 作为 分 隔 符 ， 如 下 所 示 ， 











String str = "abc def hello.\n world",; 
String[] fields = str.split("[\\s.]+"); 





fields 内 容 为 : 





[abc, def, hello, world] 








需要 说 明 的 是 ， 尾 部 的 空白 字符 串 不 会 包含 在 返回 的 结果 数组 中 ， 
但 头 部 和 中 间 的 空白 字符 串 会 被 包含 在 内 ， 比 如 : 


String Str = ",abc,,def,,",; 

String[] fields = str.split(","); 
System.out.println("field num: "+fields.1length); 
System.out.println(Arrays.toString(fields)); 





输出 为 : 





field num: 4 
[, abc, , def] 





如 果 字 符 串 中 找 不 到 匹配 regex 的 分 隔 符 ， 返 回 数组 长 度 为 1， 元 素 
为 原 字 符 串 。 


Pattern 也 有 split 方 法 ， 与 String 方 法 的 定义 类 似 : 





public String[] split(CharSequence input) 





与 String 方 法 的 区 别 如 下 。 


1) Pattern 接 受 的 参数 是 CharSequence， 更 为 通用 ， 我 们 知道 
String、StringBuilder、StringBuffer、CharBuffer 等 都 实现 了 该 接口 。 


2) 如 果 regex 长 度 大 于 1 或 包含 元 字符 ，String 的 Split 方 法 必须 移 将 
regex 编 译 为 Pattern 对 象 ， 再 调用 Pattern 的 split 方 法 ， 这 时 ， 为 避免 重复 
编译 ， 应 该 优先 采用 Pattern 的 方法 。 





3) 如 琳 regex 束 是 一 个 字符 且 不 是 元 字符 ，String 的 split 方 法 会 采用 
更 为 简单 高 效 的 实现 ， 所 以 ， 这 时 应 该 优先 采用 String 的 split 方 法 。 


3. 验 证 


验证 就 是 检验 输入 文本 是 否 完 整 罗 配 预 定义 的 正则 表达 式 ， 经 常用 
于 检验 用 户 的 输入 是 否 合法 。String 有 如 下 方法 : 





public boolean matches(String regex) 





比如 : 





String regex = "\\d{8}"; 
String str = "12345678"，; 
System,.out.println(str.matches(regex)); 





检查 输入 是 否 是 8 位 数字 ， 输 出 为 true。 


String 的 matches 实 际 调用 的 是 Pattern 的 如 下 方法 : 





public static boolean matches(String regex, CharSequence input) 





这 是 一 个 静态 方法 ， 它 的 代码 为 : 





public static boolean matches(String regex, CharSequence input) { 
Pattern p = Pattern.compile(regex); 
Matcher m = p.matcher(input); 
return m.matches(); 





就 是 先 调 用 compile 编 译 regex 为 Pattern 对 象 ， 再 调用 Pattern 的 
matcher 方 法 生成 一 个 匹配 对 象 Matcher，Matcher 的 matches 方 法 返回 是 否 
完整 匹配 。 

4. 查 找 


查找 就 是 在 文本 中 寻找 匹配 正则 表达 式 的 子 字 符 串 ， 看 个 例子 : 








public static void find(){ 
String regex = "\\d{4}-\\d{2}-\\d{2}",，; 
Pattern pattern = Pattern.compile(regex); 
String str = "today is 2017-06-02, yesterday is 2017-06-01"; 
Matcher matcher = pattern.matcher(str); 
while(matcher.find()){ 
System,out.printJln("find "+matcher.group() 
+" position: "+matcher.start()+"-"+matcher.end()); 





代码 寻找 所 有 类 似 "2017-06-02" 这 种 格式 的 日 期 ， 输 出 为 : 





find 2017-06-02 position: 9-19 
find 2017-06-01 position: 34-44 





Matcher 的 内 部 记录 有 一 个 位 置 ， 起 始 为 0，find 方 法 从 这 个 位 置 查 
找 匹 配 正则 表达 式 的 子 字 符 串 ， 找 到 后 ， 返 回 true， 并 更 新 这 个 内 部 位 
置 ， 匹 配 到 的 子 字 符 串 信息 可 以 通过 如 下 方法 获取 : 








// 匹 配 到 的 完整 子 字符 串 
public String group() 

// 子 字符 串 在 整个 字符 串 中 的 起 始 位 置 
public int start() 

// 子 字符 串 在 整个 字符 串 中 的 结束 位 置 加 1 
public int end() 
































group 〈) 其 实 调用 的 是 group 〈0) ， 表 示 获 取 匹 配 的 第 0 个 分 组 的 
内 容 。 我 们 在 上 节 介 绍 过 捕获 分 组 的 概念 ， 分 组 0 是 一 个 特殊 分 组 ， 表 
示 匹 配 的 整个 子 字符 串 。 除 了 分 组 0，Matcher 还 有 如 下 方法 ， 获 取 分 组 
的 更 多 信息 : 





/分 组 个 数 

public int groupCount() 

// 分 组 编号 为 group 的 内 容 

public String group(int group) 
// 分 组 命名 为 name 的 内 容 

public String group(String name) 
// 分 组 编号 为 group 的 起 始 位 置 

public int start(int group) 

// 分 组 编号 为 group 的 结束 位 置 加 1 
public int end(int group ) 























二 一 


比如 : 





public static void findGroup() { 
String regex = "(\\d{4})-(\\d{2})-(\\d{2})"; 
Pattern pattern = Pattern.compile(regex); 
String str = "today is 2017-06-02, yesterday is 2017-06-01"; 
Matcher matcher = pattern.matcher(str); 
while (matcher.find()) { 
System.out.printin("year:" + matcher.group(1) 
+ ",month:" + matcher.group(2) + ",day:" + matcher.group(3)); 


输出 为 : 





year :2017,month:06,day:02 
year:2017,month:06,day:01 





5. 蔡 换 


9 一 个 闸 见 的 后 续 操 作 是 替换 。String 有 多 个 谷 





public String replace(char oldCchar, char newChar ) 

public String replace(CharSequence target, CharSequence replacement) 
public String replaceAll(String regex, String replacement) 

public String replaceFirst(String regex, String replacement) 





第 一 个 replace 方 法 操作 的 是 单个 字符 ， 第 二 个 是 CharSequence， 它 
们 都 是 将 参数 看 作 普 通 字 符 。 而 replaceAll 和 replaceFirst 则 将 参数 regex 看 
作 正 则 表达 式 ， 它 们 的 区 别 是 ，replaceAll 蔡 换 所 有 找到 的 子 字符 串 ， 而 
replaceFirst 则 只 替换 第 一 个 找到 的 。 看 个 简单 的 例子 ， 将 字符 串 中 的 多 
个 连续 空白 字符 蔡 换 为 一 个 : 





String regex = "\\s+t"; 
String str = "hello world good"; 
System.out.println(str.replaceAll(regex, " ")); 





输出 为 : 





hello world good 





在 replaceAll 和 replaceFirst 中 ， 参 数 replacement 也 不 是 被 看 作 普 通 的 
可 以 使 用 美元 符号 加 数字 的 形式 《比如 $1〉 引 用 捕获 分 组 。 我 
们 看 个 例子 : 





String regex = "(\\d{4})-(\\d{2})-(\\d{2})"; 
String str = "today is 2017-06-02."; 
System.out.printlin(str.replaceFirst(regex, "$1/$2/$3")); 





输出 为 : 





today is 2017/06/02. 





这 个 例子 将 找到 的 日 期 字符 串 的 格式 进行 了 转换 。 所 以 ， 字 符 '$ 在 
0 如 果 和 需要 痊 换 为 字符 '$' 本 映 ， 需 要 使 用 转 义 。 
广 例 了 寺 -: 





String regex = "#",，; 
String str = "#this is a test"; 
System.out.println(str.replaceAll(regex, "\\$")); 





如 果 蔡 换 字 符 串 是 用 户 提 供 的 ， 为 避免 元 字符 的 干扰 ， 可 以 使 用 
Matcher 的 如 下 静态 方法 将 其 视 为 普通 字符 串 : 





public static String quoteReplacement(String s) 





String 的 replaceAl1 和 replaceFirst 调 用 的 其 实 是 Pattern 和 Matcher 中 的 
方法 。 比 如 ，replaceAl 的 代码 为 : 





public String replaceAll(String regex, String replacement) { 
return Pattern.compile(regex).matcher(this).replaceAll(replacement); 





replaceAll 和 replaceFirst 都 定义 在 Matcher 中 ， 除 了 一 次 性 的 替换 操 
作 外 ，Matcher 还 定义 了 边 碍 找 、 边 蔡 换 的 方法 : 





public Matcher appendReplacement(StringBuffer sb, String replacement) 
public StringBuffer appendTail(StringBuffer sb) 





这 两 个 方法 用 于 和 find () 一 起 使 用 ， 我 们 先 看 个 例子 : 





public static void replaceCat() { 
Pattern p = Pattern.compile("cat"); 
Matcher m = p.matcher("one cat, two cat, three cat"); 
StringBuffer sb = new StringBuffer(); 
int foundNum = 0; 


while(m.find()) { 
m.appendReplacement(sb, "dog"); 
foundNum++; 
if(foundNum == 2) { 
break; 
} 


} 
m.appendTail( sb); 
System.out.printiln(sb.toString()); 





在 这 个 例子 中 ， 我 们 将 前 两 个 "cat" 蔡 换 为 了 "dog"， 其 他 "cat" 不 
变 ， 输 出 为 ， 





one dog, two dog, three cat 








StringBuffer 类 型 的 变量 sb 存放 最 终 的 蔡 换 结果 ，Matcher 内 部 除了 
有 一 个 查找 位 置 ， 还 有 一 个 append 位 置 ， 初 始 为 0， 当 找到 一 个 匹配 的 
子 字 符 串 后 ，appendReplacement() 做 了 三 件 事情 : 


1) 将 append 位 置 到 当前 匹配 之 前 的 子 字 符 串 append 到 sb 中 ， 在 第 一 
次 操作 中 ， 为 "one"， 第 二 次 为 "，two"。 


2) 将 傅 换 字符 串 append 到 sb 中 。 

3) 更 新 append 位 置 为 当前 匹配 之 后 的 位 置 。 

appendTail 将 append 位 置 之 后 所 有 的 字符 append 到 sb 中 。 

至 此 ， 正 则 表达 式 相关 的 主要 Java API 就 介绍 完了 。 我 们 讨论 了 如 


何在 Java 中 表示 正则 表达 式 ， 如 何 利用 它 实 现 文 本 的 切 分 、 验 证 、 碍 找 
和 任 换 ， 对 于 和 蔡 换 ， 下 面 我们 演示 一 个 简单 的 模板 引擎 。 














25.3 ”模板 引擎 


利用 Java API 尤 其 是 Matcher 中 的 几 个 方法 ， 我 们 可 以 实现 一 个 简单 
人 模板 是 一 个 字符 串 ， 中 间 有 一 些 变量 ， 以 fname} 表 示 ， 比 
D: 








String template = "Hi {name}, your code is {code}."; 





这 里 ， 模 板 字 符 串 中 有 两 个 变量 : 一 个 是 name， 为 一 个 是 code。 变 
量 的 实际 值 通 过 Map 提 供 ， 变 量 名 称 对 应 Map 中 的 键 ， 模 板 引 擎 的 任务 
0 返回 蔡 换 变量 后 的 字符 串 ， 示 例 实现 








private static Pattern tempJatePattern = Pattern.compile("\\{(\\w+)\\}"); 
public static String templateEngine(String template, 
Map<String, Object> params) { 
StringBuffer sb = new StringBuffer(); 
Matcher matcher = templatePattern.matcher(template); 
while(matcher.find()) { 
String key = matcher.group(1); 
Object value = params.get(key); 
matcher.appendReplacement(sb, value != null 
Matcher .quoteReplacement(value.toString()) : ""); 


matcher.appendTail(sb); 
return sb.toSstring(); 








代码 寻找 所 有 的 模板 变量 ， 正 则 表达 式 为 : 





\{ (Ww+)\} 





{ 是 元 字符 ， 所 以 要 转 义 。\w+ 表 示 变 量 名 ， 为 便于 引用 ， 加 了 括 
号 ， 可 以 通过 分 组 1 引用 变量 名 。 


使 用 该 模板 引擎 的 示例 代码 为 : 





public static void templateDemo() { 


String template = "Hi {name}, your code is {code}."; 
Map<String, Object> params = new HashMap<String, Object>(); 
params .put("name"，" 老 马 "); 

params.put("code", 6789); 
System.out.printlin(templateEngine(template, params)); 





输出 为 : 





Hi 老 马 ，your code is 6789. 





完整 代码 在 github 上 ， 地 址 为 https://github.com/swiftma/program- 
logic ， 位 于 包 shuo.laoma.regex.c89 下 。 下 一 节 ， 我 们 讨论 和 分 析 一 些 常 
见 的 正则 表达 式 。 


25.4 ”剖析 和 常见 表达 式 

本 节 来 讨论 和 分 析 一 些 和 常用 的 正则 表达 式 ， 具 体 包 括 : 

邮编。 

:电话 号 码 ， 包 括 手 机 号 码 和 国定 电话 号 人 码 。 

:日 期 和 时 则 。 

` 壬 份 证 号 。 

.IP 地址 。 

.URL 。 

.Email 地 址 。 

.中文 字符 。 

对 于 同一 个 目的 ， 正 则 表达 式 往 往 有 多 种 写法 ， 大 多 没有 唯一 正确 
的 写法 ， 本 节 的 写法 主要 是 示例 。 此 外 ， 写 一 个 正则 表达 式 ， 匹 配 希 望 
匹配 的 内 容 往往 比较 容易 ， 但 让 它 不 匹配 不 希望 匹配 的 内 容 则 往往 比较 
困难 ， 也 融 是 说 ， 保证 精确 性 经 党 是 很 难 的 ， 不 过 ， 很 多 时 候 ， 也 没有 
必要 写 完 全 精确 的 表达 式 ， 需 要 写 到 多 精确 与 需要 处 理 的 文本 和 需求 有 
关 。 另 外 ， 正 则 表达 式 难 以 表达 的 ， 可 以 通过 写 程序 进一步 处 理 。 这 人 么 
摘 述 可 能 比较 抽象 ， 下 面 ， 我 们 会 具体 讨论 分 析 。 
1. 邮 编 

邮编 比较 简单 ， 就 是 6 位 数字 ， 所 以 表达 式 可 以 为 : 





[0-9]{6} 





这 个 表达 式 可 以 用 于 验证 输入 是 否 为 邮编 ， 比 如 : 


public static Pattern ZIP_CODE_PATTERN = Pattern.compile("[0-9]{6}"); 
public static boolean isZipCode(String text) { 

return ZIP_CODE_PATTERN.matcher(text).matches(); 
} 





但 如 果 用 于 奉 找 ， 这 个 表达 式 是 不 够 的 ， 看 个 例子 : 





public static void findzipcode(String text) { 
Matcher matcher = ZIP_CODE_PATTERN .matcher(text) ， 
while (matcher .find()) { 
System.out.printJln(matcher .group())， 
} 


public static void main(String[] args) { 
findzipCode(" 邮 编 100013， 电 话 18612345678" ) ， 
} 





文本 中 只 有 一 个 邮编 ， 但 输出 却 为 : 





100013 
186123 





这 怎么 办 呢 ? 可 以 使 用 环视 边界 匹配 ， 对 于 左边 界 ， 它 前 面 的 字符 
不 能 是 数字 ， 坏 视 表 达 式 为 : 





(?<![0-9]) 





对 于 右边 界 ， 它 右边 的 字符 不 能 是 数字 ， 坏 视 表达 式 为 : 





(?1[0-9]) 





所 以 ， 完 整 的 表达 式 可 以 为 : 





(?<![9-9])[9-9j{t6}(?![9-9] ) 





使 用 这 个 表达 式 ， 将 ZIP CODE PATTERN 改 为 : 





public static Pattern ZIP_CODE_PATTERN = Pattern.compile( 


"(?<!1[9-9])" // 左 边 不 能 有 数字 
+ "[0-9]{6}" 
+ "(?1[9-9])")， // 右 边 不 能 有 数字 


























就 可 以 输出 期 望 的 结果 了 。6 位 数字 就 一 定 是 邮编 吗 ? 答案 当然 是 
否定 的 ， 所 以 ， 这 个 表达 式 也 不 是 精确 的 ， 如 果 需 要 更 精确 的 验证 ， 可 
以 写 程序 进一步 检查 。 

2. 手 机 号 码 


中 国 的 手机 号 码 都 是 11 们 数字， 所以， 最 简单 的 表达 式 束 是 : 








[0-9]{11} 








不 过 ， 目 前 手机 号 第 1 位 都 是 1， 第 2 位 取 值 为 ?9、4、5、7、8 之 一 ， 
所 以 更 精确 的 表达 式 是 : 





1[34578][6-9]{9} 











为 方便 表达 手机 号 ， 手 机 号 中 间 经 常 有 连 字 符 《〈 即 减 号 -) ， 形 
0: 





186-1234-5678 





为 表达 这 种 可 选 的 连 字 符 ， 表 达 式 可 以 改 为 : 





1[34578] [0-9]-?[0-9]{4}-?[0-9]{4} 





在 手机 号 前 面 ， 可 能 还 有 0、+86 或 0086， 和 手机 号 码 之 间 可 能 还 有 
be; 





©018612345678 
+86 18612345678 
©0086 18612345678 





为 表达 这 种 形式 ， 可 以 在 号 人 码 前 加 如 下 表达 式 : 





((0|\+86|0086)\s?)? 





和 邮编 类 似 ， 如 末 为 了 抽取 ， 也 要 在 左右 加 环视 边界 匹配 ， 左 右 不 
是 数字 。 所 以 ， 完 整 的 表达 式 为 : 





(?<![0-9])((0|\+86|0086)\s?)?1[34578] [0-9]-?[0-9]{4}-?[0-9]{4}(?![0-9]) 





用 Java 表 示 的 代码 为 : 





public static Pattern MOBILE PHONE_ PATTERN = Pattern.compile( 
A eb 
"((0|\\+86|0086)\\s?)?" // 0 +86 0086 
+ "1[34578][0-9]-?[9- 9 ?2[0-9]{4}" // 186-1234-5678 
"(31[0-9] )"); // 右 边 不 能 有 数字 




















3. 固 定 电话 号 码 


不 考虑 分 机 ， 中 国 的 固定 电话 一 般 由 两 部 分 组 成 : 区 号 和 市 内 号 
码 ， 区 号 是 3 到 4 位 ， 市 内 号 码 是 7 到 8 位 。 区 号 以 0 开头 ， 表 达 式 可 以 





9[9-9]{2,3} 





市 内 号 码 表 达 式 为 : 





[0-9]{7,8} 








区 号 可 能 用 括号 包含 ， 区 号 与 市 内 号 码 之 间 可 能 有 连 字 符 ， 如 以 下 





010-62265678 
(010)62265678 





整个 区 号 是 可 选 的 ， 所 以 整个 表达 式 为 : 





(\(?0[0-9]{2,3}\)?-?)?[0-9]{7, 8} 





再 加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 





public static Pattern FIXED_ PHONE_ PATTERN = Pattern.compile( 
"(?<!1[9-9])" // 左 边 不 能 有 数字 
十 pe 3}\\)?-?3)?" // 区 号 
"[0-9]{7,8}"// 市 内 号 码 
+ "(?31[0-9])"); // 右 边 不 能 有 数字 























4. 日 期 
日 期 的 表示 方式 有 很 多 种 ， 我 们 只 看 一 种 ， 形 如 : 





2017-06-21 
2016-11-1 








年 月 日 之 间 用 连 字符 分 陋 ， 月 和 日 可 能 只 有 一 位 。 最 简单 的 正则 表 
达 式 可 以 为 : 





\d{4}-\d{1,2}-\d{1,2} 





年 一 般 没 有 限制 ， 但 月 只 能 取 值 1 一 12， 日 只 能 取 值 1 一 31， 怎 么 表 
达 这 种 限制 呢 ? 


对 于 月 ， 有 两 种 情况 ，1 月 到 9 月 ， 表 达 式 可 以 为 : 








0?[1-9] 





10 月 到 12 月 ， 表 达 式 可 以 为 : 





1[9-2] 





所 以 ， 月 的 表达 式 为 : 





(9?[1-9]11[0-2]) 





对 于 日 ， 有 三 种 情况 

:1 到 9 号 ， 表 达 式 为 : 0? [1-9]。 
:10 号 到 29 号 ， 表 达 式 为 : [1-2][0-9]。 
-30 号 和 31 号 ， 表 达 式 为 : 3[01]。 
所 以 ， 整 个 表达 式 为 : 





\d{4}-(0?[1-9]|1[0-2])-(0?[1-9]|[1-2][0-9]|13[01]) 





加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 





public Stabre Pattern DATE_PATTERN = Pattern.compilel( 
"(?<1[9- 9] )" // 左 边 不 能 有 数字 
+ "\\d{4}-" // 年 
+ "(0?[1-9]11[0-2])-" 
+ "(0?[1-9] |[1-2][90- ollareu]} '// 晶 
+ "(?31[0-9])"); /右边 不 能 有 数字 



































5. 时 间 


考虑 24 小 时 制 ， 只 考虑 小 时 和 分 钟 ， 小 时 和 分 钟 都 用 固定 两 位 表 
示 ， 格 式 如 下 : 





10:57 





基本 表达 式 为 : 





\d{2}:\d{2} 





小 时 取 值 范围 为 0 一 23， 更 精确 的 表达 式 为 : 





([9-1]j[9-9]12[9-3]) 





分 钟 取 值 范围 为 0 一 59， 更 精确 的 表达 式 为 : 





[9-5][9-9] 





所 以 ， 整 个 表达 式 为 : 





([9-1]j[9-9]12[9-3]):[9-5][9-9j 





加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 





public static Pattern TIME PATTERN = Pattern.compile( 
"(?<!1[9-9])" // 左边 不 能 有 数字 
+ "([9-1][0-9]12[0-3])" /A 小 时 
十 WE 十 "[0-5] [0-9]"// 分 钟 
+ "(?1[0-9])"); // 右边 不 能 有 数字 

















6. 身 份 证 号 

身份 证 有 一 代 和 二 代 之 分 ， 一 代 吴 份 证 号 是 15 位 数字 ， 二 代 喘 份 证 
号 是 18 位 数字 ， 都 不 能 以 0 开头 。 对 于 二 代 喘 份 证 号 ， 最 后 一 位 可 能 为 x 
或 X， 其 他 是 数字 。 一 代 刁 份 证 号 表达 式 可 以 为 : 





[1-9] [0-9]{14} 





二 代 喘 份 证 号 表达 式 可 以 为 : 





[1-9] [6-9]{16}[0-9xX] 





， 人 这 两 个 表达 式 的 前 面部 分 是 相同 的 ， 二 代 身 份 证 号 表达 式 多 了 如 下 





[0-9] {2}[0-9xX] 





所 以 ， 它 们 可 以 合并 为 一 个 表达 式 ， 即 : 





[1-9] [0-9]{14}([0-9]{2}[0-9xX] )? 





加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 





public Statre Pattern ID_CARD_PATTERN = Pattern.compile( 
re // 左 边 不 能 有 数字 
"[1-9] [9-9]{14}"”// 一 代 身 份 证 
"([0-9] {2}[9-9xX] )?" // 二 代 身 份 证 多 出 的 部 分 
Tt21T6-5 人 全 /省 边 不 能 有 数学 
































符合 这 个 要 求 的 就 一 定 是 身份 证 号 吗 ? 当然 不 是 ， 号 份 证 号 还 有 一 
些 更 为 具体 的 要 求 ， 本 书 吏 不 探讨 了 。 


7.IP 地 址 
IP 地 址 示例 如 下 : 





192.168.3.5 





点 号 分 隔 ，4 段 数字 ， 每 个 数字 范围 是 0 一 255。 最 简单 的 表达 式 





(\d{1,3}\.){3}\d{1-3} 





xdft1，3} 太 简单 ， 没 有 满足 0 一 255 之 间 的 约束 ， 要 满足 这 个 约束 ， 
需要 分 多 种 情况 考虑 。 


值 是 1 位 数 ， 前 面 可 能 有 0 一 2 个 0， 表 达 式 为 : 





0{0,2}[0-9] 





值 是 两 位 数 ， 前 面 可 能 有 一 个 0， 表 达 式 为 : 





0?[0-9]{2} 





值 是 三 位 数 ， 又 要 分 为 多 种 情况 。 以 1 开头 的 ， 后 两 位 没有 限制 ， 
表达 式 为 : 





1[0-9]{2} 





以 2 开头 的 ， 如 果 第 二 位 是 0 到 4， 则 第 三 位 没有 限制 ， 表 达 式 为 : 





2[0-4][0-9] 





如 果 第 二 位 是 5， 则 第 三 位 取 值 为 0 到 5， 表 达 式 为 : 





25[0-5] 





所 以 ，\d{1，3} 更 为 精确 的 表示 为 : 





(9{t9,2}[9-9]19?[9-9]{t2}+11[9-9j{t2}12[9-4][9-9]j125[9-5]) 





所 以 ， 加 上 左右 边界 环视 ，IP 地 址 的 完整 Java 表 示 为 : 





public static Pattern IP_PATTERN = Pattern.compilel( 
有 
"((0{0,2}[0-9]19?[0-9]{2}|1[90-9]{2}12[90-4][0-9]125[0-5])\\. ){3}" 
"(0{0,2}[0-9]19?[0-9]{2}|1[90-9]{2}12[9-4][9-9]125[9-51)" 
"(2?1[0-9] )"); // 右 边 不 能 有 数字 




















8.URL 


URL 的 格式 比较 复杂 ， 其 规范 定义 
在 https:/tools.ietf.org/html/rfc1738 ， 我 们 只 考虑 HTTP 协议 ， 其 通用 格式 
日 
AE: 





http://<host>:<port>/<path>?<searchpart> 














开始 是 http:/， 接 着 是 主机 名 ， 主 机 名 之 后 是 可 选 的 端口 ， 再 之 后 
征 可 选 的 路 径 ， 路 径 后 是 可 选 的 查询 字符 串 ， 以 ?” 开头 。 看 一 些 例子 : 





http://www.example.com 
http://www.example.com/ab/c/def .html 
http://www.example.com:8080/ab/c/def?q1=abc&q2=def 





主机 名 中 的 字符 可 以 是 字母 、 数 字 、 减 号 和 点 号 ， 所 以 表达 式 可 以 








[-0-9a-zA-Z.]+ 





端口 部 分 可 以 写 为 : 





(:\d+)? 





路 径 由 多 个 子路 径 组 成 ， 每 个 子路 径 以 /开头 ， 后 跟 零 个 或 多 个 非 / 
的 字符 ， 简 单 地 说 ， 表 达 式 可 以 为 : 





(A[^/]*)* 





更 精确 地 说 ， 把 所 有 人 允许 的 字符 列 出 来 ， 表 达 式 为 : 





(/[-\w$.+!1*'(),%;:@8=]*)* 





对 于 查询 字符 串 ， 简 单 地 说 ， 由 非 空 学 符 串 组 成 ， 表 达 式 为 : 





\?[\S]* 





更 精确 的 ， 把 所 有 人 允许 的 字符 列 出 来 ， 表 达 式 为 : 





\?[-\w$.+1*'(),%;:@8=]* 





路 径 和 查询 字符 串 是 可 选 的 ， 且 查询 字符 串 只 有 在 至 少 存在 一 个 路 
径 的 情况 下 才能 出 现 ， 其 模式 为 : 





(/<sub_path>(/<sub_path>)*(\?<search>)?)? 





所 以 ， 路 径 和 碍 询 部 分 的 简单 表达 式 为 : 





(ZL[^/A]*(A[A]™)*(N?[NSI*)?)? 





精确 表达 式 为 : 





(/[-\w$.+!*'(),%;:@8=]*(/[-\w$.+!*'(),%;:@8=]*)*(\?E- WwW$.+!*'(),%;:@8=]*)?)? 





HTTP 的 完整 Java 表 达 式 为 : 





public static Pattern HTTP_PATTERN = Pattern.compile( 
"http://" + "[-0-9a-zA-Z.]+" // 主 机 名 
+ "(:NXNXd+)?" // 端 口 
+ "(" // 可 选 的 路 径 和 查询 - 开始 
+ "/[-\\w$.+!1*'(),%;:@&=]*" // 第 一 层 路 径 
"(A[-NNw$.+1*'(),%;:@8=]*)*" // 可 选 的 其 他 层 路 径 
+ "(NN\?[-\\Ww$.+1*'(),%;:@8=]*)?" // 可 选 的 查询 字符 串 
+ ")?"); // 可 选 的 路 径 和 查询 - 结束 














+ 











9.Email 地 址 


完整 的 Email 规 范 比较 复杂 ， 定 义 在 https://tools.ietf.org/html/rfc822 
， 我 们 先 看 一 些 实际 中 常用 的 。 比 如 新 浪 邮 箱 : 





abc@sina.com 





对 于 用 户 名 部 分 ， 它 的 要 求 是 : 4 一 16 个 字符 ， 可 使 用 英文 小 写 、 
数字 、 下 夯 线 ， 但 下 夯 线 不 能 在 首尾 。 怎 么 验证 用 户 名 呢 ?” 可 以 为 : 





[a-z0-9] [a-z0-9_]{2,14}[a-z0-9] 





新 浪 邮 箱 的 完整 Java 表 达 式 为 : 





public static Pattern SINA EMAIL_ PATTERN = Pattern.compilel( 
TI mh 
[a-z0-9] 
+ "[a-z0-9_]{2,14}" 
+ "[a-z0-9]@sina\\.com"); 





我 们 再 来 看 QQ 邮箱 ， 它 对 于 用 户 名 的 要 求 为 : 

1) 3 一 18 个 字符 ， 可 使 用 英文 、 数 字 、 减 号 、 点 或 下 轩 线 ; 
2) 必须 以 英文 字母 开头 ， 必 须 以 英文 字母 或 数字 结尾 ; 
3) 扩 、 减 写 、 下 男 线 不 能 连续 出 现 两 次 或 两 次 以 上 。 

如 果 只 有 第 1 条 ， 可 以 为 : 











[-0-9a-zA-Z._]{3,18} 








为 满足 第 2 条 ， 可 以 改 为 : 





[a-zA-Z][-0-9a-zA-Z._]{1,16}[a-zA-Z0-9] 








怎么 满足 第 3 条 呢 ? 可 以 使 用 边界 环视 ， 左 边 加 如 下 表达 式 : 





(?!1[-0-9a-zA-Z._]*(--|\.\.|_ )) 





完整 表达 式 可 以 为 : 





(?![-0-9a-zA-Z._]*(--|\.\.|_ ))[a-zA-Z][-0-9a-zZA-Z., ]{ 人 1,16}[a-zA-Z0-9] 





QQ 邮箱 的 完整 Java 表 达 式 为 : 





public static Pattern QQ_EMAIL_PATTERN = Pattern.compile( 
// 点 、 减 号 、 下 夯 线 不 能 连续 出 现 两 次 或 两 次 以 上 
"(2?!1[-0-9a-zA-Z._]*(--|\\.\\. = ))" 
+ "[a-zA-Z]" // 必 须 以 英文 字母 
+ "[-0-9a-zA-Z. ee 数字 、 减 号 、 点 、 下 画 线 组 成 
+ "[a-zA-Z9-9]@qq\\.com"); // 由 英文 字母 、 数 字 结 尾 














油 
| 












































以 上 都 是 特定 邮箱 服务 商 的 要 求 ， 一 般 的 邮箱 是 什么 规则 呢 ? 一 般 
De 

由 英文 字母 、 数 字 、 下 画 线 、 减 号 、 点 号 组 成 ; 

.至少 1 位 ， 不 超过 64 位 ; 

.开头 不 能 是 减 号 、 点 号 和 下 画 线 。 

比如 : 








h_l1lo-abc.good@example.com 





这 个 表达 式 可 以 为 : 





[0-9a-zA-Z][-._0-9a-zA-Z]{0,63} 








域名 部 分 以 点 号 分 隔 为 多 个 部 分 ， 人 至少 有 两 个 部 分 。 最 后 一 部 分 是 
顶级 域名 ， 由 2~3 个 英文 字母 组 成 ， 窒 达 式 可 以 为 





[a-zA-Z]{2,3} 





对 于 域名 的 其 他 后 ee I Et ee 
号 组 成 ， 但 减 号 不 能 在 开头 ， 长 度 不 能 超过 63 个 字符 ， 表 达 式 可 以 为 : 





[0-9a-zA-Z][-0-9a-zA-Z]{0,62} 





所 以 ， 域 名 部 分 的 表达 式 为 : 





([0-9a-zA-Z][-0-9a-zA-Z]{0,62}\.)+[a-zA-Z]{2,3} 





完整 的 Java 表 示 为 : 





public stole Pattern GENERAL_EMAIL_PATTERN = Pattern.compilel( 
人 = 9a-zA-Z][-. 0-9a-zA-Z]{9,631" // 用 户 名 
+ "@" 
+ "([0-9a-zA-Z][-0-9a-zA-Z]{9,62}\\,)+" // 域 名 部 分 
+ "[a-zA-Z]{2,3}"); // 顶 级 域名 


























10. 中 文学 符 


中 文字 符 的 Unicode 编 号 一 般 位 于 \u4e00~u9fff 之 间 ， 所 以 匹配 任 
意 一 个 中 文字 符 的 表达 式 可 以 为 : 





[\u4e00-\u9fff] 





Java 表 达 式 为 : 





public static Pattern CHINESE_ PATTERN = Pattern.compilel( 
"[\\u4e00-\\u9fff]"); 





11. 小 结 


本 节 详 细 讨 论 和 分 析 了 一 些 和 常见 的 正则 表达 式 。 在 实际 开发 中 ， 有 
些 可 以 直接 使 用 ， 有 些 需要 根据 具体 文本 和 需求 进行 调整 。 完 整 的 代码 
在 Github 上 ， 地 址 为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.regex.c90 下 。 


人 至此， 关于 正则 表达 式 束 介绍 完了 。 下 一 章 ， 我 们 探讨 Java 8 中 的 





第 26 间 ”函数 式 编程 


Java 8 引入 了 一 个 重要 新 语法 一 一 Lambda 表 达 式 ， 它 是 一 种 紧凑 的 
传递 代码 的 方式 ， 利 用 它 ， 可 以 实现 简洁 灵活 的 函数 式 编 程 。 


基于 Lambda 表 达 式 ， 人 针对 常见 的 集合 数据 处 理 ，Java 8 引入 了 一 套 
新 的 类 库 ， 位 于 包 java.util.stream 下 ， 称 为 Stream API。 这 套 API 操 作 数 
据 的 思路 不 同 于 我 们 之 前 介绍 的 容器 类 API， 它 们 是 函数 式 的 ， 非 常人 简 
洁 、 灵 活 、 易 读 。 


Stream API 是 对 容器 类 的 增强 ， 它 可 以 将 对 集合 数据 的 多 个 操作 以 
流水 线 的 方式 组 合 在 一 起 。Java 8 还 增加 了 一 个 新 的 类 
CompletableFuture， 它 是 对 并 发 编程 的 增强 ， 可 以 方便 地 将 多 个 有 一 定 
依赖 关系 的 异步 任务 以 流水 线 的 方式 组 合 在 一 起 ， 大 大 简化 多 异步 任务 
的 开发 。 

利用 Lambda 表 达 式 ，Java 8 还 增强 了 日 期 和 时 间 API。 

本 章 束 来 介绍 这 些 Java 8 引入 的 函数 式 编 程 特性 和 API， 有 具 体 分 为 5 
节 : 26.1 节 介绍 Lambda 表 达 式 ; 26.2 节 介绍 函数 式 数 据 处 理 的 基本 用 


法 ;26.3 节 重点 讨论 函数 式 数据 处 理 中 的 收集 器 ，26.4 节 介绍 组 合式 异 
步 编 程 CompletableFuture; 26.5 节 介绍 Java 8 的 日 期 和 时 间 API。 





26.1 Lambda 表达 式 

Lambda 表 达 式 到 底 是 什么 ”有 什么 用 ? 本 节 进 行 详 细 探 讨 。 
Lambda 这 个 名 字 来 源 于 学 术 界 的 演算 ， 有 具 体 我 们 惑 不 探讨 了 。 理 解 
Lambda 表 达 式 ， 我 们 需要 先 回顾 一 下 接口 、 匿 名 内 部 类 和 代码 传递 。 
26.1.1 通过 接口 传递 代码 

我 们 之 前 介绍 过 接口 以 及 面向 接口 的 编程 ， 针 对 接口 而 非 具体 类 型 
进行 编程 ， 可 以 降低 程序 的 厢 合 性 ， 提 高 灵活 性 ， 提 高 复 用 性 。 接 口 常 
被 用 于 传递 代码 ， 比如 ， 我 们 知道 File 有 如 下 方法 : 


public File[] listFiles(FilenameFilter filter) 





listFiles 需 要 的 其 实 不 是 FilenameFilter 对 象 ， 而 是 它 包含 的 如 下 方 
法 : 





boolean accept(File dir, String name); 


或 者 说 ，listFiles 希 望 接受 一 段 方法 代码 作为 参数 ， 但 没有 办 法 直接 
传递 这 个 方法 代码 本 映 ， 只 能 传递 一 个 接口 。 


再 如 ， 类 Collections 中 的 很 多 方法 都 接受 一 个 参数 Comparator， 比 
如 : 





public static <T> void sort(List<T> list, Comparator<? super T> c) 





它们 需要 的 也 不 是 Comparator 对 象 ， 而 是 它 包含 的 如 下 方法 : 


int compare(T o1, T 02); 


但 是 ， 没 有 办 法 直接 传递 方法 ， 只 能 传递 一 个 接口 。 


又 如 ， 异 步 任 务 执行 服务 ExecutorService， 提 交 任 务 的 方法 有 : 





<T> Future<T> submit(Callable<T> task) ， 
Future<?> submit(Runnable task); 





Callable 和 Runnable 接 口 也 用 于 传递 任务 代码 。 


通过 接口 传递 行为 代码 ， 就 要 传递 一 个 实现 了 该 接口 的 实例 对 象 ， 
在 之 前 的 章节 中 ， 最 简洁 的 方式 是 使 用 匿名 内 部 类 ， 比 如 : 

















// 列 出 当前 目录 下 的 所 有 扩展 名 为 .txt 的 文件 
File f = new File("."); 
File[] files = f.listFiles(new FilenameFilter(){ 
Q@Override 
public boolean accept(File dir, String name) { 
if(name.endswith(".txt")){ 
return true; 




















return false; 


} 
}); 





将 fies 按照 文件 名 排序 ， 代 人 码 为 : 





Arrays.sort(files, new Comparator<File>() { 
Q@Override 
public int compare(File f1, File f2) { 
return f1i.getName().compareTo(f2.getName()); 


}); 





提 区 一 个 最 简单 的 任务 ， 代 码 为 : 





ExecutorService executor = Executors.newFixedThreadPool1(100); 
executor.submit(new Runnable() { 
Q@Override 
public void run() { 
System.out.printin("hello world"); 
} 


}); 





26.1.2 Lambda 语法 


Java 8 提供 了 一 种 新 的 紧凑 的 传递 代码 的 语法 : Lambda 表 达 式 。 对 
于 前 面 列 出 文件 的 例子 ， 代 码 可 以 改 为 : 





File f = new File("."); 
File[] files = f.listFiles((File dir, String name) -> { 
if(name.endswith(".txt")) { 
return true; 


return false; 


}); 





可 以 看 出 ， 相 比 匿名 内 部 类 ， 传 递 代码 变 得 更 为 直观 ， 不 再 有 实现 
接口 的 模板 代码 ， 不 再 声明 方法 ， 也 没有 名 字 ， 而 是 直接 给 出 了 方法 的 
实现 代码 。Lambda 表 达 陈 由 -> 分 隔 为 两 部 分 ， 前 面 是 方法 的 参数 ， 后 面 
们 内 是 方法 的 代码 。 上 面 的 代码 可 以 简化 为 : 





File[] files = f.listFiles((File dir, String name) -> { 
return name.endswith(".txt"); 


}); 








当主 体 代码 只 有 一 条 语句 的 时 候 ， 括 号 和 retum 语 句 也 可 以 省 略 ， 
上 面 的 代码 可 以 变 为 : 





File[] files = f.listFiles((File dir，String name) -> name.endswith(".txt")); 








注意 : 没有 括号 的 时 候 ， 主 体 代码 是 一 个 表达 式 ， 这 个 表达 式 的 值 
就 是 函数 的 返回 值 ， 结 尾 不 能 加 分 号 ， 也 不 能 加 return 语 句 。 


方法 的 参数 类 型 声明 也 可 以 省 略 ， 上 面 的 代码 还 可 以 继续 简化 为 : 





File[] files = f.listFiles((dir, name) -> name.endswith(".txt")); 





之 所 以 可 以 省 略 方法 的 参数 类 型 ， 是 因为 Java 可 以 目 动 推断 出 来 ， 
它 知 道 listFiles 接 受 的 参数 类 型 是 FilenameFilter， 这 个 接口 只 有 一 个 方法 
accept， 这 个 方法 的 两 个 参数 类 型 分 别 是 File 和 String。 这 样 简化 下 来 ， 
代码 是 不 是 简洁 多 了 ? 


排序 的 代码 用 Lambda 表 达 式 可 以 写 为 : 








Arrays.sort(files, (f1, f2) -> fi.getName().compareTo(f2.getName())); 





提交 任务 的 代码 用 Lambda 表 达 式 可 以 写 为 : 





executor.submit(()->System.out.printin("hello")); 





区 下 吊 个 鸭 全 时 人 时 闪 


当 参 数 只 有 一 个 的 时 候 ， 参 数 部 分 的 括号 可 以 省 略 。 比 如 ，File 还 
有 如 下 方法 : 





public File[] listFiles(FileFilter filter) 





FileFilter 的 定义 为 : 





public interface FileFilter { 
boolean accept(File pathname); 


} 





使 用 FileFilter 重 写 上 面 的 列举 文件 的 例子 ， 代 码 可 以 为 : 





File[] files = f.1listFiles(path -> path.getName().endswith(".txt")); 





与 匿名 内 部 类 类 似 ，Lambda 表 达 式 也 可 以 访问 定义 在 主体 代码 外 
部 的 变量 ， 但 对 于 局 部 变量 ， 它 也 只 能 访问 final 类 型 的 变量 ， 与 匿名 内 
。 比 如 : 




















String msg = "hello wor1d"; 
executor .Submit(()->System,out.println(msg))， 





可 以 访问 局 部 变量 msg， 但 msg 不 能 被 重新 赋值 ， 如 果 这 样 写 : 





String msg = "hello wor1d"; 
msg = "good morning",; 
executor .Submit(()->System,out.println(msg) )， 





Java 编 译 器 会 提示 错误 。 


这 个 原因 与 匿名 内 部 类 是 一 样 的 ，Java 会 将 msg 的 值 作为 参数 传递 
给 Lambda 表 达 式 ， 为 Lambda 表 达 式 建立 一 个 副本 ， 它 的 代码 访问 的 是 
这 个 副本 ， 而 不 是 外 部 声明 的 msg 变 量 。 如 采 人 允许 msg 被 修改 ， 则 程序 
员 可 能 会 误 以 为 Lambda 表 达 式 读 到 修改 后 的 值 ， 引 起 更 多 的 混 消 。 


为 什么 非 要 建立 副本 ， 直 接 访问 外 部 的 msg 变 量 不 行 吗 ? 不 行 ， 因 
为 msg 定 义 在 栈 中 ， 当 Lambda 表 达 式 被 执行 的 时 候 ，msg 可 能 早已 被 释 
放 了 。 如 果 希 望 能 够 修改 值 ， 可 以 将 变量 定义 为 实例 变量 ， 或 者 将 变量 
定义 为 数组 ， 比 如 ; 

















String[] msg = new String[]{"hello world"}; 
msg[0] = "good morning"; 
executor.submit(()->System,.out.printin(msg[0])); 





从 以 上 内 容 可 以 看 出 ，Lambda 表 达 式 与 匿名 内 部 类 很 像 ， 主 要 就 
是 简化 了 语法 ， 那 它 是 不 是 语法 糖 ， 内 部 实现 其 实 束 是 内 部 类 呢 ? 管 案 
是 否定 的 ，Java 会 为 每 个 匿名 内 部 类 生成 一 个 类 ， 但 Lambda 表 达 式 不 
会 。Lambda 表 达 式 通常 比较 短 ， 为 每 个 表达 式 生 成 一 个 类 会 生成 大 量 


的 类 ， 性 能 会 受到 影响 。 


内 部 实现 上 ，Java 利 用 了 Java 7 引入 的 为 文 持 动 态 类 型 语言 引入 的 
invokedynamic 指 令 、 方 法 句柄 (method handle) 等， 具体 实现 比较 复 
杂 ， 我 们 融 不 探讨 了 ， 感 兴趣 的 读者 可 以 参 
看 http://cr.openjdk.java.net/~briangoetz/lambda/lambda-translation.html ， 
我 们 需要 知道 的 是 ，Java 的 实现 是 非常 融 效 的 ， 不 用 担心 生成 太 多 类 的 
问题 。 


Lambda 表 达 式 不 是 匿名 内 部 类 ， 那 它 的 类 型 到 瓜 是 什么 昵 ?” 是 阴 
数 式 接口 。 








26.1.3 ”水 数 式 接口 





Java 8 引入 了 函数 式 接 口 的 概念 ， 函 数 式 接口 也 是 接口 ， 但 只 能 有 
一 个 抽象 方法 ， 前 面 提 及 的 接口 都 只 有 一 个 抽象 方法 ， 都 是 函数 却 接 
口 。 之 所 以 强调 是 “抽象 ”方法 ， 是 因为 Java 8 中 还 允许 定义 静态 方法 和 
默认 方法 。Lambda 表 达 式 可 以 赋值 给 函数 式 接 口 ， 比 如 : 





FileFilter filter = path -> path.getName().endswith(".txt"); 

FilenameFilter fileNameFilter = (dir, name) -> name.endswith(".txt"); 

Comparator<File> comparator = (f1i, f2) -> 
fi.getName().compareTo(f2.getName()); 

Runnable task = () -> System.out.println("hello world"); 








如 果 看 这 些 接 口 的 定义 ， 会 发 现 它们 都 有 一 个 注解 
@FunctionalInterface， 比 如 : 





Q@FunctionalInterface 
public interface Runnable { 
public abstract void run(); 





@FunctionalInterface 用 于 清晰 地 告知 使 用 者 这 是 一 个 函数 式 接口 ， 
不 过 ， 这 个 注解 不 是 必需 的 ， 不 加 ， 只 要 只 有 一 个 抽象 方法 ， 也 是 函数 
式 接口 。 但 如 果 加 了 ， 而 又 定义 了 超过 一 个 抽象 方法 ，Java 编 译 器 会 报 
错 ， 这 类 似 于 我 们 之 前 介绍 的 Override 注 解 。 


26.1.4 预定 义 的 函数 式 接 口 


Java 8 定义 了 大 量 的 预定 义 函 数 式 接口 ， 用 于 常见 类 型 的 代码 传 
递 ， 这 些 函 数 定义 在 包 java.util.function 下 ， 主 要 接口 如 表 26-1 所 示 。 


表 26-1 主要 的 预定 义 函 数 式 接口 


Preloved 谓词 ， 测 试 输入 是 否 满足 条 件 
Function<T, R> 函数 转换 ， 输 入 类 型 T， 输 出 类 型 RR 
Consumer<T> 消费 者 ， 输 入 类 型 T 

Supplier<T> LB 方术 

UnaryOperator<T> 函数 转换 的 特例 ， 输 入 和 输出 类 型 一 样 


BiFunction<T, U, R> 函数 转换 ， 接 受 两 个 参数 ， 输 出 了 
BinaryOperator<T> BiFunction 的 特例 ， 输 入 和 输出 类 型 一 样 
BiConsumer<T, U> 消费 者 ， 接 受 两 个 参数 

BiPredicate<T, U> 谓词 ， 接 受 两 个 参数 


对 于 基本 类 型 boolean、int、long 和 double， 为 避免 装 箱 / 拆 箱 ，Java 
8 提供 了 一 些 专门 的 函数 ， 比 如 ，int 相 关 的 部 分 函数 如 表 26-2 所 示 。 


表 26-2 ”int 类 型 的 函数 式 接口 


IntPredicate 谓词 ， 测 试 输入 是 否 满 足 条 件 
IntFunction<R> 函数 转换 ， 输 入 类 型 int， 输 出 类 型 R 
IntConsumer 消费 者 ， 输 入 类 型 int 

IntSupplier 国有 车 


这 些 函 数 有 什么 用 呢 ? 它 们 被 大 量 用 于 Java 8 的 函数 式 数据 处 理 
Stream 相 关 的 类 中 ， 即 使 不 使 用 Stream， 也 可 以 在 自己 的 代码 中 直接 使 
用 这 些 预 定义 的 函数 。 我 们 看 一 些 简 单 的 示例 ， 包 括 Predicate、 


Function 和 Consumer。 
1.Predicate 示 例 


为 便于 举例 ， 我 们 先 定 义 一 个 简单 的 学 生 类 Student， 它 有 name 和 
score 两 个 属性 ， 如 下 所 示 。 





static class Student { 
String name 
double score; 


} 





我 们 省 略 了 构造 方法 和 getter/setter 方 法 。 





List<Student> students = Arrays.asList(new Student[] { 
new Student("zhangsan", 89d), new Student("1lisi", 89d), 
new Student("wangwu", 98d) }); 














在 日 常 开 及 中， 列表 处 理 的 一 个 常见 需求 是 过 滤 ， 列 表 的 类 型 经 党 
不 一 样 ， 过 小 的 条 件 也 经 常 变 化 ， 但 主体 逻辑 都 是 类 似 的 ， 可 以 借助 
Predicate 写 一 个 通用 的 方法 ， 如 下 所 示 : 





public static <E> List<E> filter(List<E> list, Predicate<E> pred) { 
List<E> retList = new ArrayList<>(); 
for(E e : list) { 
if(pred.test(e)) { 
retList.add(e); 
} 


return retList,; 





这 个 方法 可 以 这 么 用 : 





// 过 滤 99 分 以 上 的 
students = filter(students, t -> t,getScore() > 90); 





2.Function 示 例 


列表 处 理 的 另 一 个 常见 需求 是 转换 。 比 如 ， 给 定 一 个 学 生 列表 ， 需 
要 返回 名 称 列 表 ， 或 者 将 名 称 转换 为 大 写 返 回 ， 可 以 借助 Funcion 芭 一 
个 通用 的 方法 ， 如 下 所 示 : 





public static <T, R> List<R> map(List<T> list, Function<T, R> mapper) { 
List<R> retList = new ArrayList<>(l1ist.size()); 
for(Te : list) { 
retList,add(mapper .apply(e)); 
} 


return retList,; 





根据 学 生 列表 返回 名 称 列 表 的 代码 为 : 





List<String> names = map(students, t -> t.getName()); 





将 学 生 名 称 转换 为 大 写 的 代码 为 : 





students = map(students, t -> new Student( 
t.getName().toUpperCase(), t.getscore())); 





3.Consumer 示 例 


在 上 面 转换 学 生 名 称 为 大 写 的 例子 中 ， 我 们 为 每 个 学 WU 
新 的 对 象 ， 另 一 种 常见 的 情况 是 直接 修改 原 对 象 ， 通 过 代码 传递 ， 
时 ， 可 以 用 Consumer 写 一 个 通用 的 方法 ， 比 如 : 








public static <E> void foreach(List<E> list, Consumer<E> consumer) { 
for(E e : list) { 
consumer .accept (e); 
} 
} 








上 面 转换 为 大 写 的 例子 可 以 改 为 : 





foreach(students, t -> t.setName(t.getName().toUpperCase())); 





以 上 这 些 示 例 主 要 用 于 演示 函数 式 接口 的 基本 概念 ， 实 际 中 可 以 直 
接 使 用 流 API。 


26.1.5 ”方法 引用 


Lambda 表 达 式 经 常用 于 调用 对 象 的 茶 个 方法 ， 比 如 : 





List<String> names = map(students, t -> t.getName()); 








List<String> names = map(students, Student::getName); 





Student: : getName 这 种 写法 是 Java 8 引入 的 一 种 新 语法 ， 称 为 方法 


引用 。 它 是 Lambda 表 达 式 的 一 种 简写 方法 ， 由 : : 分 隔 为 两 部 分 ， 前 
面 是 类 名 或 变量 名 ， 后 面 是 方法 名 。 方 法 可 以 是 实例 方法 ， 也 可 以 是 静 
态 方法 ， 但 含义 不 同 。 


我 们 看 一 些 例子 ， 还 是 以 Student 为 例 ， 先 增加 一 个 静态 方法 : 

















public static String getCollegeName(){ 
return "Laoma School"; 





对 于 静态 方法 ， 如 下 两 条 语句 是 等 价 的 : 





1. Supplier<String> S 
2. Supplier<String> s 


Student::getCollegeName; 
() -> Student ,getCollegeName() ， 





它们 的 参数 都 是 空 ， 返 回 类 型 为 String。 
而 对 于 实例 方法 ， 它 的 第 一 个 参数 束 是 该 类 型 的 实例 ， 比 如 ， 如 下 


两 条 语句 是 等 价 的 : 





1. Function<Student, String> f 
2. Function<Student, String> f 


Student: :getName; 
(Student t) -> t.getName(); 





对 于 Student: : setName， 它 是 一 个 BiConsumer， 即 如 下 两 条 语句 
是 等 价 的 : 





1. BiConsumer<Student, String> c 
2. BiConsumer<Student, String> c 


Student: :setName; 
(t, name) -> t.setName(name); 


1 1 








如 果 方 法 引用 的 第 一 部 分 是 变量 名 ， 则 相当 于 调用 那个 对 象 的 方 
法 。 比 如 ,假定 t 是 一 个 Student 类 型 的 变量 ， 则 如 下 两 条 语句 是 等 从 
的 ; 








1. Supplier<String> s 
2. Supplier<String> s 


t::getName; 
() -> t.getName(); 





下 面 两 条 语句 也 是 等 价 的 : 





1. Consumer<String> consumer = t::setName; 
2. Consumer<String> consumer = (name) -> t.setName(name); 








对 于 构造 方法 ， 方 法 引用 的 语法 是 < 类 名 >: : new， 如 Student: : 
new， 即 下 面 两 条 语句 等 价 : 





1. BiFunction<String, Double, Student> s = (name, score) 
-> new Student(name, score); 
2. BiFunction<String, Double, Student> s = Student::new; 





26.1.6 ”函数 的 复合 


在 前 面 的 例子 中 ， 函 数 式 接口 都 用 作 方 法 的 参数 ， 其 他 部 分 通过 
Lambda 表 达 式 传递 具体 代码 给 它 。 函 数 式 接口 和 Lambda 表 达 式 还 可 用 
作 方 法 的 返回 值 ， 传 递 代 码 回调 用 者 ， 将 这 两 种 用 法 结合 起 来 ， 可 以 构 
造 复合 的 函数 ， 使 程序 简洁 易 读 。 


下 面 我 们 看 一 些 例子 ， 这 些 例子 利用 了 Java 8 对 接口 的 增强 ， 即 静 
I 并 利用 它们 实现 复合 函数 ， 包 括 Comparator 接 口 和 
function 包 。 


1.Comparator 中 的 复合 方法 
Comparator 接 口 定义 了 如 下 静态 方法 : 





public static <T, U extends Comparable<? super U>> Comparator<T> comparing( 
Function<? super T, ? extends U> keyExtractor) { 
Objects.requireNonNull(keyExtractor); 
return (Comparator<T> & Serializable) 
(c1, c2) -> keyExtractor.apply(c1).compareTo(keyExtractor.apply(c2)); 





这 个 方法 是 什么 意思 呢 ?” 它 用 于 构建 一 个 Comparator， 比 如 ， 在 前 
面 的 例子 中 ， 对 文件 按照 文件 名 排序 的 代码 为 : 








Arrays.sort(files, (f1, f2) -> fi.getName().compareTo(f2.getName())); 





使 用 comparing 方 法 ， 代 码 可 以 简化 为 : 





Arrays.sort(files, Comparator.comparing(File: :getName)); 





这 样 ， 代 码 的 可 读 性 是 不 是 大 大 增强 了 ? comparing 方 法 为 什么 能 
达到 这 个 效果 呢 ? 它 构 建 并 返回 了 一 个 符合 Comparator 接 口 的 Lambda 表 
达 式 ， 这 个 Comparator 接 受 的 参数 类 型 是 File， 它 使 用 了 传递 过 来 的 函 
数 代 码 keyExtractor 将 File 转 换 为 String 进 行 比较 。 像 comparing 这 样 使 用 
ee 但 调用 者 很 方便 ， 也 很 容易 理 
符 。 





Comparator 还 有 很 多 默认 方法 ， 我 们 看 两 个 : 





default Comparator<T> reversed() { 
return Collections.reverseOrder(this),; 


default Comparator<T> thenComparing(Comparator<? super T> other) { 
Objects.requireNonNull(other); 
return (Comparator<T> & Serializable) (ci1, c2) -> { 
int res = compare(ci1, c2); 
return (res != 0) ? res : other.compare(c1, c2); 








reversed 返 回 一 个 新 的 Comparator， 按 原 排序 逆序 排 。 
thenComparing 也 返回 一 个 新 的 Comparator， 在 原 排序 认为 两 个 元 素 排序 
相同 的 时 候 ， 使 用 传递 的 Comparator other 进 行 比 较 。 


看 一 个 使 用 的 例子 ， 将 学 生 列表 按照 分 数 倒序 排 〈 高 分 在 前 ) ， 分 
数 一 样 的 按照 名 字 进 行 排序 : 











students,.sort(Comparator,. comparing(Student: :getScore) 
reversed () 
.thenComparing(Student : :getName ) ) ; 











这 样 ， 代 码 是 不 是 很 容易 读 ? 


2.function 包 中 的 复合 方法 


在 java.util.function 包 的 很 多 函数 式 接 口 里 ， 都 定义 了 一 些 复 合 方 
法 ， 我 们 看 一 些 例子 。 


Function 接 口 有 如 下 定义 : 





default <V> Function<T, V> andThen(Function<? Super R, ? extends V> after) { 
Objects.requireNonNull(after ); 
return (T t) -> after.apply(apply(t)); 

} 








先 将 T 类 型 的 参数 转化 为 类 型 R， 再 调用 after 将 R 转 换 为 VY， 最 后 返 
回 类 型 V。 


还 有 如 下 定义 : 





default <V> Function<V, R> compose( 
Function<? super V, ? extends T> before) { 
Objects.requireNonNull(before); 
return (V v) -> apply(before.apply(v)); 
} 





对 V 类 型 的 参数 ， 先 调用 before 将 V 转 换 为 T 类 型 ， 再 调用 当前 的 
apply 方 法 转换 为 R 类 型 返回 。 


Consumer、Predicate 等 都 有 一 些 复合 方法 ， 它 们 大 量 用 于 函数 式 数 
据 处 理 API 中 ， 有 共 体 我 们 就 不 探讨 了 。 


66.17 第 


本 节 介 绍 了 Java 8 中 的 一 些 新 概念 ， 包 括 Lambda 表 达 式 、 函 数 式 接 
口 和 方法 引用 等 。 


最 重要 的 变化 是 ， 传 递 代码 变 得 简单 了 ， 函 数 变 为 了 代码 世界 
的 “一 等 公民 ”， 可 以 方便 地 被 作 为 参数 传递 ， 被 作为 返回 值 ， 被 复合 利 
用 以 构建 新 的 函数 ， 看 上 去 ， 这 些 只 是 语法 上 的 一 些小 变化 ， 但 利用 这 
些小 变化 ， 却 能 使 得 代码 更 为 通用 、 更 为 灵活 、 更 为 简洁 易 读 ， 这 大 概 





就 是 函数 式 纺 程 的 奇妙 之 处 。 


26.2” 子 数 式 数 据 人 处理 : 基本 用 法 


上 一 节 介 绍 了 Lambda 表 达 式 和 函数 式 接口 ， 本 节 探 讨 它们 的 应 
用 : 函数 式 数据 处 理 ， 针 对 常见 的 集合 数据 处 理 ，Java 8 引入 了 一 套 新 
的 类 库 ， 位 于 包 java.util.stream 下 ， 称 为 Stream API 。 这 套 API 操 作 数 据 
的 思路 不 同 于 我 们 之 前 介绍 的 容器 类 API， 它 们 是 函数 式 的 ， 非 常 简 
洁 、 灵 活 、 吻 恋 。 具 体 有 什么 不 同 呢 ? 本 市 先 介绍 一 些 基本 的 API， 下 


节 讨论 一 些 高 级 功能 。 


接口 Stream 类 似 于 一 个 迭代 器 ， 但 提供 了 更 为 丰富 的 操作 ，Stream 
API 的 主要 操作 就 定义 在 该 接口 中 。Java 8 给 Collection 接 口 增加 了 两 个 
默认 方法 ， 它 们 可 以 返回 一 个 Stream， 如 下 所 示 : 














default Stream<E> stream() { 
return StreamSupport.stream(spliterator(), false); 


} 
default Stream<E> parallelStream() { 
return StreamSupport.stream(spliterator(), true); 


} 





stream 〈) 返回 的 是 一 个 顺序 流 ，parallelStream() 返回 的 是 一 个 
并 行 流 。 顺 序 流 就 是 由 一 个 线程 执行 操作 。 而 并 行 流 背 后 可 能 有 多 个 
线程 并 行 执行 ， 与 之 前 介绍 的 并 发 技术 不 同 ， 使 用 并 行 流 不 需要 显 式 管 
理 线程 ， 使 用 方法 与 顺序 流 是 一 样 的 。 


下 面 我 们 主要 针对 顺序 流 学 习 Stream 接 口 ， 包 括 其 用 法 和 基本 原 
理 ， 随 后 我 们 再 介绍 并 行 流 ， 先 来 看 一 些 简单 的 示例 。 











26.2.1 基本 示例 


上 一 节 演 示 时 使 用 了 学 后 类 Student 和 学 生 列 表 List<Student>lists， 
本 节 继 续 使 用 它们 ， 看 一 些 基 本 的 过 滤 、 转 换 以 及 过 滤 和 转换 组 合 的 例 


1. 基 本 过 渡 


返回 学 生 列 表 中 90 分 以 上 的 ， 传 统 上 的 代码 一 般 是 这 样 : 





List<Student> above90List = new ArrayList<>(); 
for(Student t : students) { 
if(t.getSscore() > 90) { 
above90List .add(t); 
} 
} 





使 用 Stream API， 代 码 可 以 这 样 : 





List<Student> above90List = students.stream() 
.filter(t->t.getScore()>90).collect(Collectors.toList()); 





先 通过 stream () 得 到 一 个 Stream 对 象 ， 然 后 调用 Stream 上 的 方 
法 ，filter () 过 滤 得 到 90 分 以 上 的 ， 它 的 返回 值 依然 是 一 个 Stream， 为 
了 转换 为 List， 调 用 了 collect 方 法 并 传递 了 一 个 Collectors.toList () ， 表 
示 将 结果 收集 到 一 个 List 中 。 


代码 更 为 简洁 易 恋 了 ， 这 种 数据 处 理 方式 称 为 函数 式 数 据 处 理 。 
与 传统 代码 相 比 ， 其 特点 是 : 


1) 没有 显 式 的 循环 和 欠 代 ， 循 环 过 程 被 Stream 的 方法 隐藏 了 。 


2) 提供 了 声明 式 的 处 理 函 数 ， 比 如 filtter， 它 封装 了 数据 过 滤 的 功 
能 ， 而 传统 代码 是 命令 式 的 ， 需 要 一 步 步 的 操作 指令 。 


3) 流畅 式 接口 ， 方 法 调用 链接 在 一 起 ， 清 晰 易 读 。 
2. 基 本 转换 
根据 学 生 列 表 返 回 名 称 列表 ， 传 统 上 的 代码 一 般 是 这 样 : 





List<String> nameList = new ArrayList<>(students.size()); 
for(Student t : students) { 

nameList.add(t.getName()); 
} 





使 用 Stream API， 代 码 可 以 这 样 : 


List<String> nameList = students.stream() 
.map(Student: :getName).collect(Collectors.toList()); 





这 里 使 用 了 Stream 的 map 函 数 ， 它 的 参数 是 一 个 Function 函 数 式 接 
口 ， 这 里 传递 了 方法 引用 。 


3. 基 本 的 过 小 和 转换 组 合 
返回 90 分 以 上 的 学 生 名 称 列表 ， 传 统 上 的 代码 一 般 古 这 样 : 





List<String> nameList = new ArrayList<>(); 
for(Student t : students) { 
if(t.getscore() > 90 
nameList.add(t.getName()); 
} 


} 





使 用 函数 式 数据 处 理 的 思路 ， 可 以 将 这 个 问题 分 解 为 由 两 个 基本 函 
数 实现 : 


1) 过 小 : 得 到 90 分 以 上 的 学 生 列表 。 
2) 转换 : 将 学 生 列 表 转 换 为 名 称 列 表 。 


使 用 Stream API， 可 以 将 基本 函数 filter () 和 map 〈) 结合 起 来 ， 
代码 可 以 这 样 : 





List<String> above90Names = students.stream() 
.filter(t->t.getScore()>90).map(Student::getName) 
.collect(Collectors.toList()); 





这 种 组 合 利用 基本 函数 、 声 明 式 实现 集合 数据 处 理 功 能 的 编程 风 
格 ， 就 是 函数 式 数据 处 理 。 


代码 更 为 直观 易 读 了 ， 但 你 可 能 会 担心 它 的 性 能 有 问题 。filter 〈 ) 
和 map 《〈) 都 需要 对 流 中 的 每 个 元 系 操 作 一 次 ， 一 起 使 用 会 不 会 就 需要 
遍历 两 次 呢 ? 答案 是 否定 的 ， 只 需要 一 次 。 实 际 上 ， 调 用 filter〈) 和 
map《〈) 都 不 会 执行 任何 实际 的 操作 ， 它 们 只 是 在 构建 操作 的 流水 线 ， 
调用 collect 才 会 触发 实际 的 过 历 执行 ， 在 一 次 这 历 中 完成 过 滤 、 转 换 以 








及 收集 结果 的 任务 。 


像 flter 和 map 这 种 不 实际 触发 执行 、 用 于 构建 流水 线 、 返 回 Stream 
的 操作 称 为 中 间 操 作 (intermediate operation) ， 而 像 collect 这 种 触发 实 
际 执行 、 返 回 具体 结果 的 操作 称 为 终 剖 操作 (terminal operation〉。 
Stream API 中 还 有 更 多 的 中 间 和 终端 操作 ， 下 面 我 们 具体 介绍 。 





26.2.2 ”中 间 操 作 


除了 filter 和 map，Stream API 的 中 间 操 作 还 有 distinct、sorted、 
skip、 limit、peek、mapToLong、mapTolInt、mapToDouble、flatMap 
等 ， 我 们 逐个 介绍 。 


1.distinct 


distinct 返 回 一 个 新 的 Stream， 过 滤 重 复 的 元 素 ， 只 留 下 唯一 的 元 
素 ， 是 人 否 重复 是 根据 equals 方 法 来 比较 的 ，distinct 可 以 与 其 他 函数 《如 
filter、map) 结合 使 用 。 比 如 ， 返 回 字 符 串 列表 中 长 度 小 于 3 的 字符 串 、 
转换 为 小 写 、 只 保留 唯一 的 ， 代 码 可 以 为 : 

















List<String> list = Arrays.asList(new String[]{"abc","def","hello","Abc"}); 

List<String> retList = list.stream() 
.filter(s->s.length()<=3).map(String::toLowerCase).distinct() 
.collect(Collectors.toList()); 





虽然 都 是 中 间 操 作 ， 但 distinct 与 filter 和 map 是 不 同 的 。filter 和 map 
都 是 无 状态 的 ， 对 于 流 中 的 每 一 个 元 素 ， 处 理 都 是 独立 的 ， 处 理 后 即 
交 给 流水 线 中 的 下 一 个 操作 ;distinct 不 同 ， 它 是 有 状态 的 ， 在 处 理 过 程 
中 ， 它 需要 在 内 部 记录 之 前 出 现 过 的 元 素 ， 如 果 已 经 出 现 过 ， 即 重复 元 
素 ， 它 就 会 过 滤 挥 ， 不 传递 给 流水 线 中 的 下 一 个 操作 。 对 于 顺序 流 ， 内 
部 实现 时 ，distinct 操 作 会 使 用 HashSet 记 录 出 现 过 的 元 素 ， 如 果 流 是 有 
顺序 的 ， 需 要 保留 顺序 ， 会 使 用 LinkedHashSet。 








2.sorted 


有 两 个 sorted 方 法 





Stream<T> Sorted() 
Stream<T> sorted(Comparator<? super T> comparator) 





它们 都 对 流 中 的 元 素 排 序 ， 都 返回 一 个 排序 后 的 Stream。 第 一 个 方 
法 假定 元 素 实现 了 Comparable 接 口 ， 第 二 个 方法 接受 一 个 自 定 义 的 
Comparator。 比 如 ， 过 滤 得 到 90 分 以 上 的 学 生 ， 然 后 按 分 数 从 高 到 低 排 
序 ， 分 数 一 样 的 按 名 称 排 序 ， 代 码 为 : 








List<Student> list = students.stream().filter(t->t.getScore( )>90) 
.Sorted(Comparator.comparing(Student::getScore) 
.reversed().thenComparing(Student::getName)) 
.collect(Collectors.toList()); 





这 里 ， 使 用 了 Comparator 的 comparing、reversed 和 thenComparing 构 
建 了 Comparator。 


与 distinct 一 样 ，sorted 也 是 一 个 有 状态 的 中 间 操 作 ， 在 处 理 过 程 
中 ， 和 需要 在 内 部 记录 出 现 过 的 元 素 。 其 不 同 是 ， 每 倍 到 流 中 的 一 个 元 
素 ，distinct 都 能 立即 做 出 处 理 ， 要 么 过 滤 ， 要 么 马上 传递 给 下 一 个 操 
作 ; sorted 需 要 先 排 序 ， 为 了 排序 ， 它 需要 先 在 内 部 数组 中 保存 磁 到 的 
每 一 个 元 素 ， 到 流 结 尾 时 再 对 数组 排序 ， 然 后 再 将 排序 后 的 元 素 逐 个 传 
递 给 流水 线 中 的 下 一 个 操作 。 


3.skip/limit 
它们 的 定义 为 : 











Stream<T> skip(long n) 
Stream<T> limit(long maxSize) 





skip 跳 过 流 中 的 n 个 元 素 ， 如 末 流 中 元 系 不 足 n 个 ， 返 回 一 个 空 流 ， 
limit 限 制 流 的 长 度 为 maxSize。 比 如 ， 将 学 生 列 表 按 照 分 数 排序 ， 返 回 
第 3 名 到 第 5 名 ， 代 码 为 : 








List<Student> list = students.stream() 
.Sorted(Comparator.comparing(Student::getScore).reversed()) 
.Skip(2).1imit(3).collect(Collectors.toList()); 








skip 和 limit 都 是 有 状态 的 中 间 操 作 。 对 前 n 个 元 素 ，skip 的 操作 就 是 
过 小 ， 对 后 面 的 元 系 ，skip 残 是 传递 给 流水 线 中 的 下 一 个 操作 。limit 的 
一 个 特点 是 : 它 不 需要 处 理 流 中 的 所 有 元 素 ， 只 要 处 理 的 元 素 个 数 达到 
。 后 面 的 元 素 束 不 需要 处 理 了 ， 这 种 可 以 提前 结束 的 操作 称 为 
吕 路 操作 。 


skip 和 1limit 只 能 根据 元 素数 目 进 行 操作 ，Java 9 增加 了 两 个 新 方法 ， 
相当 于 更 为 通用 的 skip 和 limit: 
































// 通 用 的 skip， 在 谓词 返回 为 true 的 情况 下 一 直 进 行 skip 操 作 ， 直 到 某 次 返回 false 
default Stream<T> dropwhile(Predicate<? super T> predicate) 

// 通 用 的 limit， 在 谓词 返回 为 true 的 情况 下 一 直接 受 ， 直 到 某 次 返回 false 
default Stream<T> takewhile(Predicate<? super T> predicate) 

























































































4.peek 
peek 的 定义 为 : 





Stream<T> peek(Consumer<? super T> action) 





它 返回 的 流 与 之 前 的 流 是 一 样 的 ， 没 有 变化 ， 但 它 提供 了 一 个 
Consumer， 会 将 流 中 的 每 一 个 元 素 传 给 该 Consumer。 这 个 方法 的 主要 
目的 是 支持 调试 ， 可 以 使 用 该 方法 观察 在 流水 线 中 流转 的 元 素 ， 比 如 : 








List<String> above90Names = Students,stream().filter(t->t.getScore()>90) 
.peek(System.out::println).map(Student::getName) 
.collect(Collectors.toList()); 





5.mapToLong/mapToInt/mapToDouble 


map 函 数 接受 的 参数 是 一 个 Function<T，R>， 为 避免 装 箱 / 拆 箱 ， 提 
高 性 能 ，Stream 还 有 如 下 返回 基本 类型 特定 流 的 方法 : 








DoubleStream mapToDouble(ToDoubleFunction<? Super T> mapper) 
IntStream mapToInt(ToIntFunction<? super T> mapper) 
LongStream mapToLong(ToLongFunction<? super T> mapper) 





DoubleStream/IntStream/LongStream 是 基本 类 型 特定 的 流 ， 有 一 些 
专门 的 更 为 高 效 的 方法 。 比 如 ， 求 学 生 列表 的 分 数 总 和 ， 代 码 为 : 





double sum = students,stream( ) ,mapToDouble(Student: :getScore),Sum( )， 





6.flatMap 


flatMap 的 定义 为 : 





<R> Stream<R> flatMap(Function<? super T, ? extends Stream<? extends R>> mapper) 





它 接受 一 个 函数 mapper， 对 流 中 的 每 一 个 元 素 ，mapper 会 将 该 元 素 
转换 为 一 个 流 Stream， 然 后 把 新 生成 流 的 每 一 个 元 素 传递 给 下 一 个 操 
作 O 比如 2 





List<String> lines = Arrays.asList(new String[]{ 
"hello abc", " 老 马 编程 "}); 
List<String> words = lines.stream() 
.flatMap(line -> Arrays.stream(line.split("\\s+"))) 
.Ccollect(Collectors.toList()); 
System.out.println(words); 








这 里 的 mapper 将 一 行 字符 串 按 空白 符 分 隔 为 了 一 个 单词 流 ， 
Arrays.stream 可 以 将 一 个 数组 转换 为 一 个 流 ， 输 出 为 : 





[hello，abc， 老 马 ， 编 程 ] 





可 以 看 出 ， 实 际 上 ，flatMap 完 成 了 一 个 1 到 n 的 映射 。 
26.2.3 ”终端 操作 


中 间 操 作 不 触发 实际 的 执行 ， 返 回 值 是 Stream， 而 终端 操作 触发 执 
行 ， 返 回 一 个 具体 的 值 ， 除 了 collect，Stream API 的 终端 操作 还 有 max、 
min、 count、allMatch、anyMatch、noneMatch、findFirst、findAny、 
forEach、toArray、reduce 等 ， 我 们 逐个 介绍 。 


1.max/min 


max/min 的 定义 为 : 





Optional<T> max(Comparator<? super T> comparator) 
Optional<T> min(Comparator<? super T> comparator) 











它们 返回 流 中 的 最 大 值 /最 小 值 ， 它 们 的 返回 值 类 型 是 
Optional<T>， 而 不 是 TT。 


java.util.Optional 古 Java 8 引入 的 一 个 新 类 ， 它 是 一 个 泛 型 容器 类 ， 
内 部 只 有 一 个 类 型 为 T 的 单一 变量 value， 可 能 为 null， 也 可 能 不 为 null。 
Optional 有 什么 用 呢 ? 它 用 于 准确 地 传递 程序 的 语义 ， 它 清楚 地 表明 ， 
其 代表 的 值 可 能 为 nuall， 程 序 员 应 该 进行 适当 的 处 理 。 


Optional 定 义 了 一 些 方法 ， 比 如 








//value 不 为 nulL1 时 返回 true 

public boolean isPresent() 

// 返 回 实际 的 值 ， 如 果 为 nul1l1， 抛 出 异常 NoSuchElementException 
public T get() 

// 如 果 value 不 为 hull1， 返 回 value， 否 则 返回 other 

public T orElse(T other) 

// 构 建 一 个 空 的 0ptional，value 为 null 

public static<T> Optional<T> empty!() 

// 构 建 一 个 非 空 的 0ptional， 参 数 value 不 能 为 null 

public static <T> Optional<T> of(T value) 

// 构 建 一 个 0ptional， 参 数 value 可 以 为 Null1， 也 可 以 不 为 null 
public static <T> Optional<T> ofNullable(T value) 












































在 max/min 的 例子 中 ， 通 过 声明 返回 值 为 Optional， 我 们 可 以 知道 有 具 
体 的 返回 值 不 一 定 存在 ， 这 发 生 在 流 中 不 含 任何 元 素 的 情况 下 。 


看 个 简单 的 例子 ， 返 回 分 数 最 高 的 学 生 ， 代 码 为 : 








Student Student = students,stream( ) 
.max(Comparator ,comparing(Student: :getScore),reversed()),get(); 





这 里 ， 假 定 students 不 为 空 。 


2.count 


count 很 简单 ， 就 是 返回 流 中 元 系 的 个 数 。 比 如 ， 统 计 大 于 90 分 的 
学 生 个 数 ， 代 码 为 : 


3.allMatch/anyMatch/noneMatch 


这 几 个 函数 都 接受 一 个 谓词 Predicate， 返 回 一 个 boolean 值 ， 用 于 判 
定 流 中 的 元 素 是 个 满足 一 定 的 条 件 。 它 们 的 区 别 是 : 








long above90Count = students.stream().filter(t->t.getScore()>90).count(); 





allMatch: 只 有 在 流 中 所 有 元 素 都 满足 条 件 的 情况 下 才 返 回 true。 
anyMatch: 只 要 流 中 有 一 个 元 素 满 足 条 件 束 返回 true。 
noneMatch: 只 有 流 中 所 有 元 素 都 不 满足 条 件 才 返 回 true。 
-如 果 流 为 空 ， 那 么 这 几 个 函数 的 返回 值 都 是 true。 


比如 ， 判 断 是 不 是 所 有 学 生 都 及 格 了 不 小 于 60 分 〉， 代 码 可 以 














boolean allPass = students.stream().allMatch(t->t.getScore( )>=60); 





这 几 个 操作 都 是 短路 操作 ， 不 一 定 需要 处 理 所 有 元 素 束 能 得 出 结 
果 ， 比 如 ， 对 于 al-Match， 只 要 有 一 个 元 系 不 满足 条 件 ， 融 能 返回 


false。 
4.findFirst/findAny 


它们 的 定义 为 : 





Optional<T> findFirst() 
Optional<T> findAny() 





DR So ed 如 果 流 为 空 ， 
Optional.empty () 。findFirst 返 回 第 一 个 元 素 ， es 回 任 一 元 


素 ， 它 们 都 是 短路 操作 。 随 便 找 一 个 不 及 格 的 学 生 ， 代 码 可 以 为 : 





Optional<Student> Student = students.stream( ).filter(t->t.getScore()<60) 
.findAny( ); 
if(student.isPpresent())t{ 
// 处 理 不 及 格 的 学 生 
} 








5.forEach 


有 两 个 forEach 方 法 : 





void forEach(Consumer<? Super T> action) 
void forEachordered(Consumer<? Super T> action) 





它们 都 接受 一 个 Consumer， 对 流 中 的 每 一 个 元 素 ， 传 递 元 素 给 
Consumer。 区 别 在 于 : 在 并 行 流 中 ，forEach 不 保证 处 理 的 顺序 ， 而 
forEachOrdered 会 保证 按照 流 中 元 素 的 出 现 顺 序 进行 处 理 。 


比如 ， 逐 行 打印 大 于 90 分 的 学 生 ， 代 码 可 以 为 : 





Students.stream( ) .filter(t->t.getScore()>90).forEach(System.out::println)， 





6.toArray 
toArray 将 流转 换 为 数组 ， 有 两 个 方法 : 





Object[] toArray() 
<A> A[] toArray(IntFunction<A[]> generator ) 





不 带 参数 的 toArray 返 回 的 数组 类 型 为 Object[]， 这 通常 不 是 期 望 的 
结果 ， 如 果 希 望 得 到 正确 类 型 的 数组 ， 需 要 传递 一 个 类 型 为 IntFunction 
的 generator。IntFunction 的 定义 为 : 





public interface IntFunction<R> { 
R apply(int value); 





generator 接 受 的 参数 是 流 的 元 素 个 数 ， 它 应 该 返回 对 应 大 小 的 正确 
类 型 的 数组 。 


比如 ， 获 取 90 分 以 上 的 学 生 数 组 ， 代 码 可 以 为 : 





Student[] above90Arr = students.stream().filter(t->t.getScore( )>90) 
.toArray(Student[]::new); 





Student[]: : new 就 是 一 个 类 型 为 IhtFunction<Student[]> 的 
generator。 


7.reduce 


reduce 代 表 归 约 或 者 叫 折 准 ， 它 是 max/min/count 的 更 为 通用 的 函 
数 ， 将 流 中 的 元 素 归 约 为 一 个 值 。 有 三 个 reduce 消 数 : 








Optional<T> reduce(BinaryOperator<T> accumulator ); 

T reduce(T identity, BinaryOperator<T> accumulator); 

<U> U reduce(U identity, BiFunction<U, ? super T, U> accumulator, 
BinaryOperator<U> combiner); 





第 一 个 reduce 函 数 基本 等 同 于 调用 : 





boolean foundAny = false; 
T result = null; 
for(T element : this stream) { 
if(!foundAny) { 
foundAny = true; 
result = element; 


else 
result = accumulator.apply(result, element); 


} 
return foundAny ? Optional.of(result) : Optional.empty!(); 





比如 ， 使 用 reduce 函 数 求 分 数 最 融 的 学 生 ， 代 码 可 以 为 : 





Student topStudent = students.stream().reduce((accu, t) -> { 
if(accu.getScore() >= t.getScore()) { 
return accu; 
} else { 
return t; 


} 
}).get(); 





第 二 个 reduce 函 数 多 了 一 个 identity 参 数 ， 表 示 初 始 值 ， 它 基本 等 同 
于 调用 : 





T result = identity; 
for(T element : this stream) 

result = accumulator.apply(result, element) 
return result,; 





第 一 个 和 第 二 个 reduce 函 数 的 返回 类 型 只 能 是 流 中 元 素 的 类 型 ， 而 
第 三 个 reduce 函 数 更 为 通用 ， 它 的 归 约 类 型 可 以 自 定义 ， 男 外 ， 它 多 了 
一 个 combiner 参 数 。combiner 用 在 并 行 流 中 ， 用 于 合并 子 线 程 的 结果 。 
对 于 顺序 流 ， 它 基本 等 同 于 调用 : 





U result = identity,; 
for(T element : this stream) 

result = accumulator.apply(result, element) 
return result,; 








注意 与 第 二 个 reduce 函 数 相 区 分 ， 它 的 结果 类 型 不 是 T， 而 是 U。 比 
如 ， 使 用 reduce 函 数 计算 学 生 分 数 的 和 ， 代 码 可 以 为 : 





double sumScore = students,stream(),reduce(0d， 
(sum, t) -> Sum += t.getScore(), 
(sum1i, sum2) -> Sum1l += Sum2 








从 以 上 可 以 看 出 ，reduce 函 数 虽 然 更 为 通用 ， 但 比较 费解 ， 难 以 使 
用 ， 一 般 情 况 下 应 该 优先 使 用 其 他 函数 。collect 函 数 比 reduce 函 数 更 为 
通用 、 强 大 和 易 用 ， 关 于 它 ， 我 们 稍 后 再 详细 介绍 。 


26.2.4 ”构建 流 
前 面 我 们 主要 使 用 的 是 Collection 的 stream 方 法 ， 换 做 parallelStream 


方法 ， 就 会 使 用 并 行 流 ， 接 口 方法 都 是 通用 的 。 但 并 行 流 内 部 会 使 用 多 
线程 ， 线 程 个 数 一 般 与 系统 的 CPU 核 数 一 样 ， 以 充分 利用 CPU 的 计算 能 


pa 


进一步 来 说 ， 并 行 流 内 部 会 使 用 Java 7 引入 的 fork/join 框 架 ， 即 处 理 
由 fork 和 join 两 个 阶段 组 成 ，fork 就 是 将 要 处 理 的 数据 拆 分 为 小 块 ， 多 线 
程 按 小 块 进行 并 行 计 算 ，join 就 是 将 小 块 的 计算 结 末 进行 合并 ， 有 具体 我 
们 就 不 探讨 了 。 使 用 并 行 流 ， 不 需要 任何 线程 管理 的 代码 ， 束 能 实现 并 
行 。 





除了 通过 Collection 接 口 的 stream/parallelStream 获 取 流 ， 还 有 一 些 其 
他 方式 可 以 获取 流 。Arrays 有 一 些 stream 方 法 ， 可 以 将 数组 或 子 数组 转 





public static IntStream stream(int[] array) 

public static DoubleStream stream(double[] array, int startInclusive, 
int endExclusive) 

public static <T> Stream<T> stream(T[] array) 





输出 当前 目录 下 所 有 普通 文件 的 名 字 ， 代 码 可 以 为 : 





File[] files = new File(".").1listFiles(); 
Arrays.stream(files).filter(File::isFile).map(File: :getName) 
.forEach(System.out: :println); 





Stream 也 有 一 些 静 态 方 法 ， 可 以 构建 流 ， 比 如 : 





// 返 回 一 个 空 流 

public static<T> Stream<T> empty( ) 

// 返 回 只 包含 一 个 元 素 t 的 流 

public static<T> Stream<T> of(T 七 ) 

// 返 回 包含 多 个 元 素 Values 的 流 

public static<T> Stream<T> of(T... values) 

// 通 过 Supplier 生 成 流 ， 流 的 元 素 个 数 是 无 限 的 

public static<T> Stream<T> generate(Supplier<T> s) 
// 同 样 生成 无 限 流 ， 第 一 个 元 素 为 seed， 第 二 个 为 f(seed)， 第 三 个 为 f(f(seed) )， 以 此 类 推 


public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f) 















































输出 10 个 随机 数 ， 代 码 可 以 为 : 





Stream.generate(()->Math.random()).1imit(10).forEach(System.out::println); 





输出 100 个 递增 的 奇数 ， 代 码 可 以 为 : 





Stream,.iterate(1, t->t+2).1limit(100).forEach(System.out::println); 





26.2.5 ”函数 式 数 据 人 处理 思 维 


可 以 看 出 ， 使 用 Stream API 处 理 数据 集合 ， 与 下 接 使 用 容器 类 API 
处 理 数据 的 思路 是 完全 不 一 样 的 。 流 定义 了 很 多 数据 处 理 的 基本 函数 ， 
对 于 一 个 具体 的 数据 处 理 问 题 ， 解 决 的 主要 思路 就 是 组 合 利用 这 些 基 本 
函数 ， 以 声明 式 的 方式 简洁 地 实现 期 望 的 功能 ， 这 种 思路 就 是 函数 式 数 
据 处 理 思 维 ， 相 比 直 接 利用 容器 类 API 的 命令 式 思维 ， 思 考 的 层次 更 


1 可 





Stream API 的 这 种 思路 也 不 是 新 发 明 ， 它 与 数据 库 查 询 语言 5QL 是 
很 像 的 ， 都 是 声明 式 地 操作 集合 数据 ， 很 多 函数 都 能 在 SQL 中 找到 对 
应 ， 比 如 filter 对 应 SQL 的 where，sorted 对 应 order by 等 。SQL 一 般 都 文 持 
分 组 (group by) 功能 ，Stream API 也 支持 ， 但 关于 分 组 ， 我 们 下 节 再 


介绍 Oo 


Stream API 也 与 各 种 基于 Unix 系 统 的 管道 命令 类 似 。 就 悉 Unix 系 统 
的 都 知道 ，Unix 有 很 多 命令 ， 大 部 分 命令 只 是 专注 于 完成 一 件 事情 ， 但 
可 以 通过 管道 的 方式 将 多 个 命令 链接 起 来 ， 完 成 一 些 复杂 的 功能 ， 比 
如 : 








cat nginx_access.1og | awk '{print $1}' | sort | uniq -c | sort -rnk 1 | head -n 20 





以 上 命令 可 以 分 析 nginx 访 问 日 志 ， 统 计 出 访问 次 数 最 多 的 前 20 个 IP 
地 址 及 其 访问 次 数 。 具 体 来 说 ，cat 命 令 输 出 nginx 访 问 日 志 到 流 ， 一 行 
为 一 个 元 素 ，awk 输 出 行 的 第 一 列 ， 这 里 为 IP 地 址 ，sort 按 IP 进 行 排 
序 ，"unig-c" 按 IP 统 计 计 数 ，"sort-mk 1" 按 计数 从 高 到 低 排 序 ，"head-n 
20" 输 出 前 20 行 。 


26.3 ”函数 式 数据 处 理 : 强大 方便 的 收集 器 


对 于 collect 方 法 ， 前 面 只 是 演示 了 其 最 基本 的 应 用 ， 它 还 有 很 多 强 
大 的 功能 ， 比 如 ， 可 以 分 组 统计 汇总 ， 实 现 类 似 数据 库 碍 询 语言 SQL 中 
的 group by 功能 。 有 具体 都 有 哪些 功能 ?” 有 什么 用 ? 如 何 使 用 ? 基本 原理 
征 什么 ? 让 我 们 逐步 进行 探讨 ， 先 来 进一步 理解 collect 方 法 。 








26.3.1 理解 collect 


在 上 节 中 ， 过 小 得 到 90 分 以 上 的 学 生 列表 ， 代 码 是 这 样 的 : 





List<Student> above90List = students.stream().filter(t->t.getScore( )>90) 
.collect(Collectors.toList()); 








最 后 的 collect 调 用 看 上 去 很 神奇 ， 它 到 底 是 怎么 把 Stream 转 换 为 
List<Student> 的 呢 ? 先 看 下 collect 方 法 的 定义 : 





<R, A> R collect(Collector<? Super T, A, R> collector) 





它 接受 一 个 收集 器 collector 作 为 参数 ， 类 型 是 Collector， 这 是 一 人 
接口 ， 它 的 定义 基本 上 是 : 








public interface Collector<T, A, R> { 
Supplier<A> supplier(); 
BiConsumer<A, T> accumulator(); 
BinaryOperator<A> combiner(),; 
Function<A, R> finisher(); 
Set<Characteristics> characteristics(); 








在 顺序 流 中 ，collect 方 法 与 这 些 接口 方法 的 交互 大 概 是 这 样 的 : 
































// 首 先 调用 工厂 方法 supplier 创 建 一 个 存放 处 理 状态 的 容器 container， 类 型 为 A 

A container = collector.supplier().get(); 

// 对 流 中 的 每 一 个 元 素 t， 调 用 累加 器 accumulator， 参 数 为 累计 状态 container 和 当前 元 素 t 
for(Tt : data) 





























collector.accumulator().accept(container, t); 
// 最 后 调用 finisher 对 累计 状态 container 进 行 可 能 的 调整 ， 类 型 转换 (A 转换 为 R)， 返 回 结果 
return collector.finisher().apply(container); 





















































combiner 只 在 并 行 流 中 有 用 ， 用 于 合并 部 分 结果 。characteristics 用 
于 标示 收集 器 的 特征 ，Collector 接 口 的 调用 者 可 以 利用 这 些 特征 进行 一 
些 优 化 。Characteristics 是 一 个 枚 举 ， 有 三 个 值 : CONCURRENT、 
UNORDERED 和 IDENTITY _FINISH， 它 们 的 含义 我 们 后 面 通过 例子 简 
要 说 明 ， 目 前 可 以 忽略 。 


Collectors.toList ( ) 具体 是 什么 昵 ? 看 下 代码 : 








public static <T> 
Collector<T, ?, List<T>> toList() { 
return new CollectorIimpl<>( (Supplier<List<T>>) ArrayList::new, List::add, 
(left, right) -> 
{ left.addAll(right); return left; }, 
CH_ID); 








它 的 实现 类 是 CollectorImpl， 这 古 Collectors 内 部 的 一 个 私有 类 ， 实 
现 很 简单 ， 主 要 束 是 定义 了 两 个 构造 方法 ， 接 受 函 数 式 参数 并 赋值 给 内 
部 变量 。 对 toList 来 说 : 


1) supplier 的 实现 是 ArrayList: : new， 也 就 是 创建 一 个 ArrayList 作 

2) accumulator 的 实现 是 List: : add， 也 就 是 将 碰 到 的 每 一 个 元 素 
加 到 列表 中 。 

3) 第 三 个 参数 是 combiner， 表 示 合 并 结果 。 


4) 第 四 个 参数 CH_ID 是 一 个 静态 变量 ， 只 有 一 个 特征 
IDENTITY_FINISH， 表 示 finisher 没 有 什么 事情 可 以 做 ， 就 是 把 累计 状 
态 container 直 接 返 回 。 


也 就 是 说 ，collect (Collectors.toList() ) 背后 的 伪 代 码 如 下 所 


外: 





List<T> container = new ArrayList<>(); 


for(T t : data) 
container .add(t); 
return container; 





26.3.2 ”容器 收集 器 


与 toList 类 似 的 容器 收集 器 还 有 toSet、toCollection、toMap 等 ， 我 们 
来 进行 介绍 。 
1.toSet 


toSet 的 使 用 与 toList 类 似 ， 只 是 它 可 以 排 重 ， 束 不 举例 了 。toList 背 
后 的 容器 是 ArrayList，toSet 背 后 的 容器 是 HashSet， 其 代码 为 : 





public static <T> 
Collector<T, ?, Set<T>> toSet() { 
return new CollectorImpl<>( (Supplier<Set<T>>) HashSet: :new, Set::add, 
(left, right) -> 
{ left.addAll(right); return left; }, 
CH_UNORDERED_ID); 





CH_UNORDERED_ID 是 一 个 静态 变量 ， 它 的 特征 有 两 个 : 一 个 是 
IDENTITY_FINISH， 表 示 返 回 结果 即 为 Supplier 创 建 的 HashSet; 另 一 个 
是 UNORDERED， 表 示 收 集 器 不 会 保留 顺序 ， 这 也 容易 理解 ， 因 为 背后 
容器 是 HashSet。 





2.toCollection 


toCollection 是 一 个 通用 的 容 右 收集 右 ， 可 以 用 于 任何 Collection 接 口 
的 实现 类 ， 它 接受 一 个 工厂 方法 Supplier 作 为 参数 ， 具 体 代码 为 : 











public static <T, C extends Collection<T>> 
Collector<T, ?, C> toCollection(Supplier<C> collectionFactory) { 
return new CollectorIimpl<>(collectionFactory, Collection<T>::add, 
(ri, r2) -> { ri.addAll(r2); return ri; }, 
CH_ID); 








比如 ， 如 果 和 希望 排 重 但 又 希望 保留 出 现 的 顺序 ， 可 以 使 用 


LinkedHashSet，Collector 可 以 这 么 创建 : 





LinkedHashSet，Collector 可 以 这 么 创建 : 
Collectors.toCollection(LinkedHashSet: :new) 





3.toMap 


toMap 将 元 素 流 转换 为 一 个 Map， 我 们 知道 ，Map 有 键 和 值 两 部 
分 ，toMap 至 少 需要 两 个 函数 参数 ， 一 个 将 元 素 转换 为 键 ， 另 一 个 将 元 
素 转换 为 值 ， 其 基本 定义 为 : 








public static <T, K, U> Collector<T, ?, Map<K,U>> toMap( 
Function<? super T, ? extends K> keyMapper, 
Function<? super T, ? extends U> valueMapper) 





返回 结果 为 Map<K，U>，keyMapper 将 元 素 转 换 为 键 ， 
valueMapper 将 元 素 转换 为 值 。 比 如 ， 将 学 生 流 转换 为 学 生 名 称 和 分 数 
的 Map， 代 码 可 以 为 : 





Map<String,Double> nameScoreMap = students.stream().collect( 
Collectors.toMap(Student::getName, Student::getScore)); 





这 里 ，Student: : getName 是 keyMapper，Student: : getScore 是 
valueMapper。 


实践 中 ， 经 和 需要 将 一 个 对 象 列 表 按 主键 转换 为 一 个 Map， 以 便 以 
后 按照 主键 进行 快速 得 找 ， 比 如 ， 假 定 Student 的 主键 是 id， 和 希望 转换 学 
生 流 为 学 生 id 和 学 生 对 象 的 Map， 代 码 可 以 为 : 





Map<String, Student> byIdMap = students,stream(),.collect( 
Collectors.toMap(Student::getId, t -> t)); 





t->t 是 valueMapper， 表 示 值 束 是 元 素 本 喘 。 这 个 函数 用 得 比较 多 ， 
接口 Function 定 义 了 一 个 静态 函数 identity 表 示 它 。 也 就 是 说 ， 上 面 的 代 
码 可 以 蔡 换 为 : 





Map<String, Student> byIdMap = students,.stream().collect( 
Collectors.toMap(Student::getId, Function.identity())); 





和 
常 ， 上 0: 





Map<String,Integer> strLenMap = Stream.of("abc","hello","abc").collect( 
Collectors.toMap(Function.identity(), t->t.length())); 








i 
序 会 殷 出 异常 。 这 种 情况 下 ， 我 们 希望 的 是 程序 忽略 后 面 重复 出 现 的 元 
素 ， 这 时 ， 可 以 使 用 另 一 个 ioMap 国 数 : 








public static <T, K, U> Collector<T, ?, Map<K,U>> toMap( 
Function<? super T, ? extends K> keyMapper, 
Function<? super T, ? extends U> valueMapper, 
BinaryOperator<U> mergeFunction) 





相 比 前 面 的 toMap， 它 接受 一 个 额外 的 参数 mergeFunction， 它 用 于 
处 理 冲 突 ， 在 收集 一 个 新 元 素 时 ， A A 
将 新 元 素 的 值 与 键 对 应 的 旧 值 一 起 传递 给 mergeFunction 得 到 一 个 值 ， 然 
后 用 这 个 值 给 键 赋值 。 


对 于 前 面 字符 串 长 度 的 例子 ， 新 值 与 旧 值 其 实 是 一 样 的 ， 我 们 可 以 
用 任意 一 个 值 ， 代 码 可 以 为 ; 








Map<String,Integer> strLenMap = Stream.of("abc","hello","abc").collect( 
Collectors.toMap(Function,.identity(), 
t->t.length(), (oldValue,value)->value)); 





有 了 时， 我 们 可 能 希望 合并 新 值 与 旧 值 ， 比 如 一 个 联系 人 列表 ， 对 于 
相同 的 联系 人 ， 我 们 希望 合并 电话 号 码 ，mergeFunction 可 以 定义 为 : 





Binaryoperator<String> mergeFunction = (oldPhone,phone)->oldPhone+"，"+phone ; 





toMap 还 有 一 个 更 为 通用 的 形式 : 





public static <T，K，U，M extends Map<K，U>> Collector<T, ?, M> toMap( 
Function<? super T, ? extends K> keyMapper, 
Function<? super T, ? extends U> valueMapper, 
BinaryOperator<U> mergeFunction, Supplier<M> mapSupplier) 





相 比 前 面 的 toMap， 多 了 一 个 mapSupplier， 它 是 Map 的 工厂 方法 ， 
对 于 前 面 的 两 个 toMap， 其 mapSupplier 其 实 是 HashMap: : new。 我 们 
知道 ，HashMap 是 没有 任何 顺序 的 ， 如 采 和 希望 保持 元 素 出 现 的 顺序 ， 可 
以 瞧 换 为 LinkedHashMap， 如 果 希 望 收 集 的 结果 排序 ， 可 以 使 用 
TreeMap。 


toMap 主 要 用 于 顺序 流 ， 对 于 并 发 流 ，Collectors 有 专门 的 名 为 
toConcurrentMap 的 收集 器 ， 它 内 部 使 用 ConcurrentHashMap， 用 法 类 
似 ， 具 体 我 们 就 不 讨论 了 。 








26.3.3 ”字符 串 收集 器 


除了 将 元 素 流 收集 到 容器 中 ， 为 一 个 常见 的 操作 是 收集 为 一 个 字符 
uh 获取 所 有 的 学 生 名 称 ， 用 如 号 连接 起 来 ， 传 统 上 代码 看 上 去 
这 样 : 





StringBuilder sb = new StringBuilder(); 
for(Student t : students){ 
if(sb.length( )>0){ 
sb.append(","); 


sb.append(t.getName()); 


return Sb.toString()， 





针对 这 种 常见 的 需求 ，Collectors 提 供 了 joining 收 集 器 ， 比 如 : 





public static Collector<CharSequence, ?, String> joining() 
public static Collector<CharSequence, ?, String> joining( 
CharSequence delimiter, CharSequence prefix, CharSequence suffix) 








第 一 个 束 是 简单 地 把 元 素 连接 起 来 ， 第 二 个 文 持 一 个 分 隔 符 ， 还 可 
以 给 整个 结果 字符 串 加 前 级 和 后 级 ， 比 如 : 








String result = Stream.of("abc"," 老 妃 ","hel1o") 
.collect(Collectors.joining("™,", "[", "]")); 
System,out.println(resujlt ) ， 





输出 为 : 





[abc, 老 马 , hello] 





joining 的 内 部 也 利用 了 StringBuilder。 比 如 ， 第 一 个 joining 函 数 的 代 
码 为 : 





public static Collector<CharSequence，?，String> joining() { 
return new CollectorIimpl<CharSequence, StringBuilder, String>( 
StringBuilder::new, StringBuilder::append, 
(ri, r2) -> { ri.append(r2); return ri; }, 
StringBuilder::toString, CH_NOID); 





supplier 是 StringBuilder: : new，accumulator 是 StringBuilder: : 
append，finisher 是 StringBuilder: : toString，CH_NOID 表 示 特 征集 为 


we 


-Lo 
26.3.4 分 组 


分 组 类 似 于 数据 库 查询 语言 SQL 中 的 group by 语句 ， 它 将 元 素 流 中 
的 每 个 元 系 分 到 一 个 组 ， 可 以 针对 分 组 再 进行 处 理 和 收集 。 分 组 的 功能 
比较 强大 ， 我 们 逐步 来 说 明 。 


为 便于 举例 ， 我 们 先 修 改 下 学 生 类 Student， 增 加 一 个 字段 grade 表 
未 年 级 : 





public Student(String name, String grade, double score) { 
this.name = name; 
this.grade grade; 
this.score score; 





示例 学 生 列 表 students 改 为 : 





static List<Student> students = Arrays.asList(new Student[] { 
new Student("zhangsan", "1", 91d), new Student("lisi", "2", 89d), 
new Student("wangwu", "1", 50d), new Student("zhaoliu", "2", 78d), 
new Student("sunqgqi", "1", 59d)}); 





1. 基 本 用 法 
最 基本 的 分 组 收集 器 为 : 





public static <T, K> Collector<T, ?, Map<K, List<T>>> 
groupingBy(Function<? super T, ? extends K> classifier) 





参数 是 一 个 类 型 为 Function 的 分 组 器 classifier， 它 将 类 型 为 T 的 元 素 
转换 为 类 型 为 K 的 一 个 值 ， 这 个 值 表示 分 组 值 ， 所 有 分 组 值 一 样 的 元 素 
会 被 归 为 同一 个 组 ， 放 到 一 个 列表 中 ， 所 以 返回 值 类 型 是 Map<K， 
List<T>>。 比 如 ， 将 学 生 流 按照 年 级 进行 分 组 ， 代 码 为 : 





Map<String, List<Student>> groups = students.stream() 
.Ccollect(Collectors.groupingBy(Student::getGrade)); 





学 生 会 分 为 两 组 : 第 一 组 键 为 "1"， 分 组 学 生 包 
括 "zhangsan""wangwu" 和 "sungi"; 第 二 组 键 为 "2"， 分 组 学 生 包 
括 "lisi""zhaoliu"。 这 段 代 码 基 本 等 同 于 如 下 代码 : 








Map<String, List<Student>> groups = new HashMap<>(); 
for(Student t : students) { 
String key = t.getGrade(); 
List<Student> container = groups.get(key); 
if(container == null) { 
container = new ArrayList<>(); 
groups.put(key, container); 


container.add(t); 








显然 ， 使 用 groupingBy 要 简洁 清晰 得 多 ， 但 它 到 撒 是 怎么 实现 的 





呢 ? 
2. 基 本 原理 


groupingBy 的 代码 为 : 





public static <T, K> Collector<T, 
groupingBy(Function<? super TT, 

return groupingBy(classifier, 
} 


2) 
? exte 
toL 


Map<K, List<T>>> 
nds K> classifier) { 
ist()); 





mz 


已 


调用 了 第 二 个 groupingBy 方 法 ， 传 递 了 toList 收 集 堪 ， 


其 代码 为 : 





public static <T, K, A, D> Collector<T, 


Function<? super T, ? extends 


?, Map<K, D>> groupingBy( 
K> classifier, 


Collector<? super T, A, D> downstream) { 


return groupingBy(classifier, Has 


hMap: :new, downstream); 





这 个 方法 接受 一 个 下 游 收集 右 downstream 作 为 参数 ， 


面 更 通用 的 函数 : 


然后 传递 给 下 





public static <T，K，D，A，M extends M 


Collector<T, ?, M> groupingBy(Functio 


Supplier<M> mapFactory, Coll 


ap<K, D>> 
n<? super T, ? extends K> classifier, 


ector<? super T, A, D> downstream) 





classifier 还 是 
HashMap: 


同一 个 分 组 内 元 素 的 结果 。 


对 最 通用 的 groupingBy 函 数 返 
和 伪 代 码 为 : 


分 组 器 ，mapFactory 是 返回 Map 的 工厂 方法 ， 
new，downstream 表 示 下 游 收 集 器 ， 下 游 收 集 器 负 


默认 是 
员 收 集 


~ 


回 的 收集 器 ， 其 收集 元 素 的 基本 过 程 





// 先 创建 一 个 存放 结果 的 Map 
Map map = mapFactory.get(); 
for(Tt : data) { 
// 对 每 一 个 元 素 ， 先 分 组 
K key classifier.apply(t); 
// 找 存放 分 组 结果 的 容器 ， 如 果 没 
A _ container = map.get(key); 
if(container null) { 




















) 
有 ， 让 下 游 收集 器 创建 





并 放 到 Map 中 
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container = downstream.supplier().get(); 


map.put(key, container); 


} 
// 将 元 素 交 给 下 游 收 集 器 ( 即 分 组 收 全 








downstream.accumulator().accept(container, 

















} 
// 调 





了 分 组 收 引 





器 的 finisher 方 法 ， 转 换 结果 





器 ) 收 集 


人 





t) ) 


for(Map.Entry entry : map.entrySet()) { 
entry.setValue(downstream.finisher().apply(entry.getValue())); 


return map; 





在 最 基本 的 groupingBy 水 数 中 ， 下 游 收 集 器 是 toList， 但 下 游 收集 器 
还 可 以 是 其 他 收集 器 ， 甚 至 是 groupingBy， 以 构成 多 级 分 组 。 下 面 我 们 
来 看 更 多 的 示例 。 


3. 分 组 计数 、 找 最 大 /最 小 元 素 
将 元 素 按 一 定 标准 分 为 多 组 ， 然 后 计算 每 组 的 个 数 ， 按 一 定 标 准 找 


最 大 或 最 小 元 素 ， 这 是 一 个 第 见 的 需求 。Collectors 提 供 了 一 些 对 应 的 收 
集 锅 ， 一 般 用 作 下 游 收集 医 ， 比 如 : 











// 计 数 

public static <T> Collector<T, ?, Long> counting() 

// 计 算 最 大 值 

public static <T> Collector<T, ?, Optional<T>> maxBy( 
Comparator<? super T> comparator) 

// 计 算 最 小 值 

public static <T> Collector<T, ?, Optional<T>> minBy( 
Comparator<? super T> comparator) 





还 有 更 为 通用 的 名 为 reducing 的 归 约 收集 器 ， 我 们 就 不 介绍 了 。 下 
面 看 一 些 例 子 。 


为 了 便于 使 用 Collectors 中 的 方法 ， 我 们 将 其 中 的 方法 静态 导入 ， 即 
加 入 如 下 代码 : 








import static java.util.stream.Collectors.*,; 





统计 每 个 年 级 的 学 生 个 数 ， 代 码 可 以 为 : 





Map<String，Long> gradeCountMap = students.stream().collect( 
groupingBy(Student::getGrade, counting())); 





统计 一 个 单词 流 中 每 个 单词 的 个 数 ， 按 出 现 顺 序 排序 ， 代 码 可 以 


NA 
. 





Map<String, Long> wordCountMap = 
Stream.of("hello", "world", "abc", "hello").collect( 
groupingBy(Function.identity(), LinkedHashMap::new, counting())); 








获取 每 个 年 级 分 数 最 高 的 一 个 学 生 ， 代 码 可 以 为 : 





Map<String, Optional<Student>> topStudentMap = students.stream().collect( 
groupingBy(Student::getGrade, 
maxBy(Comparator.comparing(Student::getScore)))); 





需要 说 明 的 是 ， 这 个 分 组 收集 结果 是 Optional<Student>， 而 不 是 
Student， 这 是 因为 maxBy 处 理 的 流 可 能 是 空 流 ， 但 对 我 们 的 例子 ， 这 是 
不 可 能 的 。 为 了 直接 得 到 Student， 可 以 使 用 Collectors 的 另 一 个 收集 器 
collectingAndThen， 在 得 到 Optional<Student> 后 调用 Optional 的 get 方 法 ， 
如 下 所 示 : 





Map<String, Student> topStudentMap = students.stream().collect( 
groupingBy(Student::getGrade, collectingAndThen( 
maxBy(Comparator.comparing(Student::getScore)), Optional::get))); 





关于 collectingAndThen， 我 们 稍 后 再 进一步 讨论 。 
4. 分 组 数值 统计 
除了 基本 的 分 组 计数 ， 还 经 常 需要 进行 一 些 分 组 数值 统计 ， 比 如 求 


学 生 分 数 的 和 、 平 均 分 、 最 高 分 、 最 低 分 等 、 针 对 int、long 和 double 类 
型 ，Collectors 提 供 了 专门 的 收集 器 ， 比 如 : 











// 求 平均 值 ，int 和 long 也 有 类 似 方 法 

public static <T> Collector<T, ?, Double> 
averagingDouble(ToDoubleFunction<? super T> mapper) 

// 求 和 ，long 和 double 也 有 类 似 方 法 

public static <T> Collector<T, ?, Integer> 
summingInt(ToIntFunction<? super T> mapper) 

// 求 多 种 汇总 信息 ，int 和 double 也 有 类 似 方法 

//LongSummaryStatistics 包 括 个 数 、 最 大 值 、 最 小 值 、 和 、 平 均值 等 多 种 信息 

public static <T> Collector<T, ?, LongSummaryStatistics> 
summarizingLong(ToLongFunction<? super T> mapper) 

















比如 ， 按 年 级 统计 学 生 分 数 信 息 ， 代 码 可 以 为 : 





Map<String, DoubleSummaryStatistics> gradeScoreStat = 
students.stream().collect(groupingBy(Student::getGrade, 
summarizingDouble(Student::getScore))); 





5. 分 组 内 的 map 


对 于 每 个 分 组 内 的 元 素 ， 我 们 感 兴趣 的 可 能 不 是 元 素 本 身 ， 而 是 它 
的 某 部 分 信息 。 在 Stream API 中 ，Stream 有 map 方 法 ， 可 以 将 元 素 进行 
转换 ，Collectors 也 为 分 组 元 素 提 供 了 函数 mapping， 如 下 所 示 : 








public static <T, U, A, R> 
Collector<T, ?, R> mapping(Function<? Super T, ? extends U> mapper, 
Collector<? super U, A, R> downstream) 





交 给 下 游 收集 器 downstream 的 不 再 是 元 素 本 身 ， 而 是 应 用 转换 函数 
比如 ， 对 学 生 按 年 级 分 组 ， 得 到 学 生 名 称 列表 ， 代 
码 可 以 为 : 





Map<String, List<String>> gradeNameMap = 
students.stream().collect(groupingBy(Student::getGrade, 
mapping(Student::getName, toList()))); 
System.out.println(gradeNameMap); 





输出 为 : 





{1=[zhangsan, wangwu, sunqgi], 2=[l1isi, zhaoliu]} 





Stream 有 flatMap 方 法 。Java 9 为 Collectors 增 加 了 分 组 内 的 flatMap 方 
法 flatMapping， 它 与 napping 的 关系 如 同 Stream 中 flatMap 和 map 的 关系 ， 
这 里 就 不 举例 了 ， 其 定义 为 : 





public static <T, U, A, R> Collector<T, ?, R> flatMapping( 
Function<? super T, ? extends Stream<? extends U>> mapper, 
Collector<? super U, A, R> downstream) 





6. 分 组 结果 处 理 (filter/sort/skip/limit) 








对 分 组 后 的 元 么 ， 我 们 可 以 计数 ， 找 最 大 /最 小 元 素 ， 计 算 一 些 数 
值 特 征 ， 还 可 以 转换 (map) 后 再 收集 ， 那 可 不 可 以 像 Stream API 一 
样 ， 排 序 (sort) 、 过 滤 (filter) 、 限 制 返回 元 素 (skip/limit〉 呢 ? 
Collector 没 有 专门 的 收集 器， 但 有 一 个 通用 的 方法 : 





public static<T,A,R,RR> Collector<T,A,RR> collectingAndThen( 
Collector<T,A,R> downstream, Function<R,RR> finisher) 





这 个 方法 接受 一 个 下 游 收集 器 downstream 和 一 个 finisher， 返 回 一 了 
收集 器 ， 它 的 主要 代码 为 : 





return new CollectorIimpl<>(downstream.supplier(), 
downstream.accumulator(),downstream.combiner(), 
downstream.finisher().andThen(finisher), characteristics); 





也 就 是 说 ， 它 在 下 游 收 集 器 的 结果 上 又 调用 了 finisher。 利 用 这 个 
finisher， 我 们 可 以 实现 多 种 功能 ， 下 面 看 一 些 例子 。 收 集 完 再 排序 ， 可 
以 定义 如 下 方法 : 





public static <T> Collector<T, ?, List<T>> collectingAndSort( 
Collector<T, ?, List<T>> downstream, Comparator<? super T> comparator) { 
return Collectors.collectingAndThen(downstream, (r) -> { 
r.sort(comparator); 
return r; 
}); 
} 





将 学 生 按 年 级 分 组 ， 分 组 内 的 学 生 按 照 分 数 由 高 到 低 进 行 排序 ， 利 
用 这 个 方法 ， 代 码 可 以 为 : 





Map<String, List<Student>> gradeStudentMap = students.stream() 
.Collect(groupingBy(Student::getGrade, collectingAndSort(toList(), 
Comparator.comparing(Student::getScore).reversed()))); 





针对 这 个 需求 ， 也 可 以 先 对 流 进行 排序 ， 然 后 再 分 组 。 
收集 完 再 过 滤 ， 可 以 定义 如 下 方法 : 





public static <T> Collector<T, ?, List<T>> collectingAndFilter( 
Collector<T, ?, List<T>> downstream, Predicate<T> predicate) { 
return Collectors.collectingAndThen(downstream, (r) -> 
return r.stream().filter(predicate).collect(Collectors.toList()); 


}); 





将 学 生 按 年 级 分 组 ， 分 组 后 ， 每 个 分 组 只 保留 不 及 格 的 学 生 《 低 于 
60 分 ) ， 利 用 这 个 方法 ， 人 代码 可 以 为 : 





Map<String，List<Student>> gradeStudentMap = students.stream() 
.Collect(groupingBy(Student::getGrade, 
collectingAndFilter(toList(), t->t.getScore()<60))); 





Java 9 中 ，Collectors 增 加 了 一 个 新 方法 filtering， 可 以 实现 相同 的 功 
能 ， 定 义 为 : 





public static <T, A, R> Collector<T, ?, R> filtering( 
Predicate<? super T> predicate, Collector<? super T, A, R> downstream) 





用 法 如 下 : 





Map<String, List<Student>> gradeStudentMap = students.stream() 
.Collect(groupingBy(Student::getGrade, 
filtering(t->t.getScore()<60, toList())); 





你 可 能 会 认为 ， 实 现 这 种 效果 也 可 以 先 对 整个 流 进 行 过 小 ， 然 后 再 
分 组 ? 比 如 这 样 : 





Map<String, List<Student>> gradeStudentMap = students.stream() 
.filter(t->t.getScore( )<60) 
.Ccollect(groupingBy(Student::getGrade, toList())); 





需要 说 明 的 是 ， 这 两 种 方式 的 结果 可 能 是 不 一 样 的 ， 如 果 是 先 过 
滤 ， 那 些 没有 任何 元 素 的 分 组 就 不 会 出 现在 结果 中 ， 而 如 果 是 先 分 组 ， 
即使 该 组 内 的 元 素 都 被 过 滤 了 ， 组 也 会 出 现在 最 终结 果 中 ， 只 是 分 组 结 
果 为 一 个 空 的 集合 。 


收集 完 ， 只 返回 特定 区 间 的 结果 ， 可 以 定义 如 下 方法 : 








有 


public static <T> Collector<T, ?, List<T>> collectingAndSkipLimit( 
Collector<T, ?, List<T>> downstream, long skip, long limit) { 
return Collectors.collectingAndThen(downstream, (r) -> { 
return r.stream().skip(skip).1limit(1imit) 
.Ccollect(Collectors,.toList()); 
}); 





比如 ， 将 学 生 按 年 级 分 组 ， 分 组 后 ， 每 个 分 组 只 保留 前 两 名 的 学 
生 ， 代 码 可 以 为 : 





Map<String, List<Student>> gradeStudentMap = students.stream() 
.Sorted(Comparator.comparing(Student::getScore).reversed()) 
.collect(groupingBy(Student::getGrade, 

collectingAndSskipLimit(toList(), ©0, 2))); 





这 次 ， 我 们 先 对 学 生 流 进行 了 排序 ， 然 后 再 进行 了 分 

mapping 利 collectingAndThen 都 接受 一 个 下 游 收 集 带 多，mapping 在 把 
元 素 交 给 下 游 收 集 占 之 前 先进 行 转换 ， 而 collectingAndThen 对 下 游 收 集 
器 的 结果 进行 转换 ， 组 合 利 用 它们 ， 可 以 构造 更 为 灵活 强大 的 收集 器 。 


7 区 


分 组 的 一 个 特殊 情况 是 分 区 ， 就 是 将 流 按 true/false 分 为 两 个 组 ， 
Collectors 有 专门 的 分 区 函数 ; 





public static <T> Collector<T, ?, Map<Boolean, List<T>>> 
partitioningBy(Predicate<? super T> predicate) 

public static <T, D, A> Collector<T, ?, Map<Boolean, D>> 
partitioningBy(Predicate<? super T> predicate, 
Collector<? super T, A, D> downstream) 





第 一 个 函数 的 下 游 收集 器 为 toList() ， 第 二 个 函数 可 以 指定 一 个 
下 游 收集 器 比如 ， 将 学 生 按 照 是 否 及 格 (大 于 等 于 60 分 ) 分 为 两 组 ， 
代码 可 以 为 : 





Map<Boolean, List<Student>> byPass = students.stream().collect( 
partitioningBy(t->t.getScore( )>=60)); 





按 是 否 及 格 分 组 后 ， 计 算 每 个 分 组 的 平均 分 ， 代 码 可 以 为 : 





Map<Boolean, Double> avgScoreMap = students,.stream().collect( 
partitioningBy(t->t.getScore()>=60, averagingDouble(Student::getSscore))); 





8. 多 级 分 组 


groupingBy 和 partitioningBy 都 可 以 接受 一 个 下 游 收集 器 ， 对 同一 个 
分 组 或 分 区 内 的 元 素 进行 进一步 收集 ， 而 下 游 收集 器 又 可 以 是 分 组 或 分 
区 ， 以 构建 多 级 分 组 。 比 如 ， 按 年 级 对 学 生 分 组 ， 分 组 后 ， 再 按照 是 否 
及 格 对 学 生 进 行 分 区 ， 代 码 可 以 为 : 





Map<String, Map<Boolean, List<Student>>> multiGroup = students,stream() 
.collect(groupingBy(Student::getGrade, 
partitioningBy(t->t.getScore( )>=60))); 





至 此 ， 关 于 函数 式 数据 处 理 Stream API 就 介绍 完了 ，Stream API 提 
供 了 集合 数据 处 理 的 常用 函数 ， 利 用 它们 ， 可 以 简洁 地 实现 大 部 分 常见 
需求 ， 大 大 减少 代码 ， 提 高 可 读 性 。 


26.4 组 合式 异步 编程 


前 面 两 节 讨 论 了 Java 8 中 的 函数 式 数据 处 理 ， 那 是 对 容器 类 的 增 
强 ， 它 可 以 将 对 集合 数据 的 多 个 操作 以 流水 线 的 方式 组 合 在 一 起 。 本 市 
继续 讨论 Java 8 的 新 功能 ， 主 要 是 一 个 新 的 类 CompletableFuture， 它 是 
对 并 发 编程 的 增强 ， 它 可 以 方便 地 将 多 个 有 一 定 依赖 关系 的 异步 任务 以 
流水 线 的 方式 组 合 在 一 起 ， 大 大 简化 多 异步 任务 的 开发 。 


之 前 介绍 了 那么 多 并 发 编程 的 内 容 ， 还 有 什么 问题 不 能 解决 ? 
CompletableFuture 到 底 能 解决 什么 问题 ?与 之 前 介绍 的 内 容 有 什么 关 
系 ? 具体 如 何 使 用 ? 基本 原理 是 什么 ? 本 市 进行 详细 讨论 ， 我 们 先 来 看 
它 要 解决 的 问题 。 





26.4.1 异步 任务 管理 





在 现代 软件 开发 中 ， 系 统 功 能 越 来 越 复 杂 ， 管 理 复 杂 反 的 方法 就 是 
分 而 治之 ， 系 统 的 很 多 功能 可 能 会 被 切 分 为 小 的 服务 ， 对 外 提供 Web 
API， 单 独 开 发 、 部 署 和 维护 。 比 如 ， 在 一 个 电 商 系统 中 ， 可 能 有 专门 
的 产品 服务 、 订 单 服务 、 用 户 服务 、 推 荐 服务 、 优 惠 服 务 、 搜 索 服务 
等 ， 在 对 外 具体 展示 一 个 页 面 时 ， 可 能 要 调用 多 个 服务 ， 而 多 个 调用 之 
间 可 能 还 有 一 定 的 依赖 。 比 如 ， 显 示 一 个 产品 页 面 ， 需 要 调用 产品 服 
务 ， 也 可 能 需要 调用 推荐 服务 获取 与 该 产品 有 关 的 其 他 推荐 ， 还 可 能 需 
要 调用 优惠 服务 获取 该 产品 相关 的 促销 优惠 ， 而 为 了 调用 优惠 服务 ， 可 
能 需要 先 调用 用 户 服务 以 获取 用 户 的 会 员 级 别 。 


另外 ， 现 代 软 件 经 常 依赖 很 多 第 三 方 服务 ， 比 如 地 图 服务 、 短 信服 
务 、 天 气 服务 、 汇 率 服务 等 ， 在 实现 一 个 具体 功能 时 ， 可 能 要 访问 多 个 
这 样 的 服务 ， 这 些 访问 之 间 可 能 存在 着 一 定 的 依赖 关系 。 


为 了 提高 性 能 ， 充 分 利用 系统 资源 ， 这 些 对 外 部 服务 的 调用 一 般 都 
应 该 是 异步 的 、 尽 量 并 发 的 。 我 们 之 前 介绍 过 异步 任务 执行 服务 ， 使 用 
ExecutorService 可 以 方便 地 提交 单个 独立 的 异步 任务 ， 可 以 方便 地 在 需 
要 的 时 候 通 过 Future 接 口 获取 异步 任务 的 结果 ， 但 对 于 多 个 尤其 是 有 一 
定 依赖 关系 的 异步 任务 ， 这 种 支持 就 不 够 了 。 


























于 是 ， 就 有 了 CompletableFuture， 它 是 一 个 具体 的 类 ， 实 现 了 两 个 
接口 ， 一 个 是 Future， 另 一 个 是 CompletionStage。EFuture 表 示 异 步 任务 的 
结果 ， 而 CompletionStage 的 字面 意思 是 完成 阶段 。 多 个 CompletionStage 
可 以 以 流水 线 的 方式 组 合 起 来 ， 对 于 其 中 一 个 CompletionStage， 它 有 一 
个 计算 任务 ， 但 可 能 需要 等 待 其 他 一 个 或 多 个 阶段 完成 才能 开始 ， 它 完 
成 后 ， 可 能 会 触发 其 他 阶段 开始 运行 。 CompletionStage 提 供 了 大 量 方 
法 ， 使 用 它们 ， 可 以 方便 地 响应 任务 事件 ， 构 建 任务 流水 线 ， 实 现 组 合 
式 异 步 编程 。 


有 具体 怎么 使 用 呢 ? 下 面 我 们 会 逐步 说 明 ，CompletableFuture 也 是 一 
个 Future， 我 们 先 来 看 与 Future 类 似 的 地 方 。 








26.4.2 ”与 Future/FutureTask 对 比 


我 们 先 通过 示例 来 简要 回顾 下 异步 任务 执行 服务 和 Future。 
1. 基 本 的 任务 执行 服务 


在 异步 任务 执行 服务 中 ， 用 Callable 或 Runnable 表 示人 任务。 以 
Callable 为 例 ， 一 个 模拟 的 外 部 任务 为 : 





private static Random rnd = new Random( ) ; 
static int delayRandom(int min, int max) { 
int milli = max > min ? rnd.nextInt(max - min) : 0; 
try { 
Thread.sleep(min + milli); 
} catch (InterruptedException e) { 


} 
return milli,; 


} 

static Callable<Integer> externalTask = () -> { 
int time = delayRandom(20, 2000); 
return time,; 


}; 





externalTask 表 示 外 部 任务 ， 我 们 使 用 了 Lambda 表 达 式 ， 
delayRandom 用 于 模拟 延 时 。 


假定 有 一 个 异步 任务 执行 服务 ， 其 代码 为 : 





private static ExecutorService executor = 


EXxecutors,newFixedThreadPool(10 ) ; 





通过 任务 执行 服务 调用 外 部 服务 ， 一 般 返 回 Future， 表 示 寞 步 结 
果 ， 示 例 代 码 为 : 





public static Future<Integer> callExternalService(){ 
return executor.submit(externalTask); 








在 主 程序 中 ， 结 合 异步 任务 和 本 地 调用 的 示例 代码 为 : 





public static void master() { 

// 执 行 异步 任务 

Future<Integer> asyncRet = callExternalService(); 

// 执 行 其 他 任务 

// 获 取 异 步 任务 的 结果 ， 处 理 可 能 的 异常 

try { 
Integer ret = asyncRet ,get()， 
System.out.println(ret )， 

} catch (InterruptedException e) { 
e.printSstackTrace(); 

} catch (ExecutionException e) { 
e.printSstackTrace( ); 











2. 基 本 的 CompletableFuture 


使 用 CompletableFuture 可 以 实现 类 似 功 能 ， 不 过 ， 它 不 支持 使 用 
Callable 表 示 异 步 任 务 ， 而 支持 Runnable 和 Supplier。Supplier 蔡 代 
Callable 表 示 有 返回 结果 的 异步 任务 ， 与 Callable 的 区 别 是 ， 它 不 能 抛 出 
受 检 异 常 ， 如 果 会 发 生 异 常 ， 可 以 抛 出 运行 时 异常 。 


使 用 Supplier 表 示 异 步 任 务 ， 代 码 与 Callable 类 似 ， 蔡 换 变 量 类 型 即 
可 : 





static Supplier<Integer> externalTask = () -> { 
int time = delayRandom(20, 2000); 
return time,; 


}; 





使 用 CompletableFuture 调 用 外 部 服务 的 代码 可 以 为 : 





public static Future<Integer> callExternalService(){ 
return CompletableFuture.supplyAsync(externalTask, executor); 





supplyAsync 是 一 个 静态 方法 ， 其 定义 为 : 





public static <U> CompletableFuture<U> supplyAsync( 
Supplier<U> supplier, Executor executor) 





它 接受 两 个 参数 supplier 和 executor， 使 用 executor 执 行 supplier 表 示 
的 任务 ， 返 回 一 个 CompletableFuture， 调 用 后 ， 任 务 被 异步 执行 ， 这 个 
方法 立即 返回 。 


supplyAsync 还 有 一 个 不 带 executor 参 数 的 方法 : 





public static <U> CompletableFuture<U> supplyAsync(Supplier<U> supplier) 





没有 executor， 任 务 被 谁 执行 呢 ? 与 系统 环境 和 配置 有 关 ， 一 般 来 
说 ， 如 果 可 用 的 CPU 核 数 大 于 2， 会 使 用 Java 7 引入 的 Fork/Join 任 务 执行 
服务 ， 即 ForkJoinPool.common-Pool () ， 访 任务 执行 服务 背后 的 工作 
线程 数 一 般 为 CPU 核 数 减 1， 即 
Runtime.getRuntime () .availableProcessors 〈) -1， 和 否则 ， 会 使 用 
ThreadPerTaskExecutor， 它 会 为 每 个 任务 创建 一 个 线程 。 


对 于 CPU 密 集 型 的 运算 任务 ， 使 用 Fork/Join 任 务 执行 服务 是 合适 
的 ， 但 对 于 一 般 的 调用 外 部 服务 的 异步 任务 ，Fork/Join 可 能 是 不 合适 
的 ， 因 为 它 的 并 行 度 比较 低 ， 可 能 会 让 本 可 以 并 发 的 多 任务 串 行 运行 ， 
这 时 ， 应 该 提供 Executor 参 数 。 

后 面 我 们 还 会 看 到 很 多 以 Async 结 尾 命名 的 方法 ， 一 般 都 有 两 个 版 
另 一 个 不 带 ， 其 含义 是 相同 的 ， 束 不 再 重复 
小 < oO 


对 于 类 型 为 Runnable 的 任务 ， 构 建 CompletableFuture 的 方法 为 : 





public static CompletableFuture<Void> runAsync( 
Runnable runnable) 


public static CompletableFuture<Void> runAsync( 
Runnable runnable, Executor executor) 





它 与 supplyAsync 是 类 似 的 ， 具 体 束 不 歼 述 了 。 
3.CompletableFuture 对 Future 的 基本 增强 


Future 有 的 接口 ，CompletableFuture 都 是 支持 的 ， 不 过 ， 
CompletableFuture 还 有 一 些 额 外 的 相关 方法 ， 比 如 : 





public T join() 
public boolean isCompletedExceptionally() 
public T getNow(T valueIfAbsent) 





join 与 get 方 法 类 似 ， 也 会 等 得 任务 结束 ， 但 它 不 会 抛 出 受 检 异 常 。 
如 果 任务 异常 结束 了 ，join 会 将 异常 包装 为 运行 时 异常 
CompletionException 抛 出 。 


Future 有 isDone 方 法 检查 任务 是 人 否 结束 了 ， 但 不 知道 任务 是 正常 结 
束 还 是 异常 结束 ，isCompletedExceptionally 方 法 可 以 判断 任务 是 否 是 异 
?J 
是 结 


getNow 与 join 类 似 ， 区 别 是 ， 如 果 任 务 还 没有 结束 ，getNow 不 会 等 
待 ， 而 是 会 返回 传 入 的 参数 valuelfAbsent。 
4. 进 一 步 理 解 Future/CompletableFuture 


前 面 例子 者 使 用 了 任务 执行 服务 ， 其 实 ， 任 务 执行 服务 与 异步 结 
Future 不 是 绑 在 一 起 的 ， 可 以 自己 创建 线程 返回 异步 结果 。 为 进一步 理 
解 ， 我 们 看 些 示例 。 


使 用 FutureTask 调 用 外 部 服务 ， 代 码 可 以 为 : 





public static Future<Integer> callExternalService() { 
FutureTask<Integer> future = new FutureTask<>(externalTastk); 
new Thread() { 
public void run() { 
future.run(); 


} 
}.start(); 
return future; 





内 部 自己 创建 了 一 个 线程 ， 线 程 调用 FutureTask 的 run 方 法 。 我 们 之 
前 分 析 过 Future-Task 的 代码 ，run 方 法 会 调用 externalTask 的 call 方 法 ， 并 
保存 结果 或 储 到 的 异常 ， 唤 醒 等 待 结果 的 线程 。 


使 用 CompletableFuture， 也 可 以 直接 创建 线程 ， 并 返回 异步 结果 ， 
代码 可 以 为 : 





public static Future<Integer> callExternalService() { 
CompletableFuture<Integer> future = new CompletableFuture<>(); 
new Thread() { 
public void run() { 
try { 
future.complete(externalTask.get()); 
} catch (Exception e) { 
future.completeExceptionally(e); 


} 


} 
}.start(); 
return future; 


} 





这 里 使 用 了 CompletableFuture 的 两 个 方法 : 





public boolean complete(T value) 
public boolean completeExceptionally(Throwable ex) 





这 两 个 方法 显 式 设置 任务 的 状态 和 结果 ，complete 设 置 任务 成 功 完 
成 ， 结 果 为 value，completeExceptionally 设 置 任务 异常 结束 ， 异 常 为 
ex。Future 接 口 没有 对 应 的 方法 ，Future-Task 有 相关 方法 但 不 是 public 的 
《是 protected 的 ) 。 设 置 完 后 ， 它 们 都 会 触发 其 他 依赖 它们 的 
CompletionStage。 有 具体 会 触发 什么 呢 ? 我 们 接 下 来 再 看 。 





26.4.3” 啊 应 结果 或 异常 


使 用 Future， 我 们 只 能 通过 get 获 取 结 采 ， 而 get 可 能 会 需要 阻塞 等 
待 ， 而 通过 Com-pletionStage， 可 以 注册 回调 函数 ， 当 任务 完成 或 异常 
结束 时 自动 触发 执行 。 有 两 类 注册 方法 : whenComplete 和 handle， 我 们 
分 别 介 绍 。 





1.whenComplete 


whenComplete 的 声明 为 : 





public CompletableFuture<T> whenComplete( 
BiConsumer<? super T, ? super Throwable> action) 





参数 action 表 示 回 调 函 数 ， 不 管 前 一 个 阶段 是 正常 结束 还 是 异常 结 
束 ， 它 都 会 被 调用 ， 函 数 类 型 是 BiConsumer， 接 受 两 个 参数 ， 第 一 个 参 
数 是 正常 结束 时 的 结果 值 ， 第 二 个 参数 是 异常 结束 时 的 异常 ， 
BiConsumer 没 有 返回 值 。whenComplete 的 返回 值 还 是 
CompletableFuture， 它 不 会 改变 原 阶 段 的 结果 ， 还 可 以 在 其 上 继续 调用 
其 他 函数 。 看 个 简单 的 示例 : 





CompletableFuture.supplyAsync(externalTask).whenCcomplete((result, ex) -> { 
if(result != null) { 
System.out.printlin(result); 


} 
if(ex != null) { 
ex.printStackTrace( ); 


} 
}).join(); 





result 表 示 前 一 个 阶段 的 结果 ，ex 表 示 异 常 ， 只 可 能 有 一 个 不 为 
null。 


whenComplete 注 册 的 函数 具体 由 谁 执行 昵 ? 一 般 而 言 ， 这 要 看 注册 
时 任务 的 状态 。 如 果 注 册 时 任务 还 没有 结束 ， 则 注册 的 函数 会 由 执行 任 
务 的 线程 执行 ， 在 该 线程 执行 完 任 务 后 执行 注册 的 函数 : 如 果 注 册 时 任 
务 已 经 结束 了 ， 则 由 当前 线程 〈 即 调用 注册 函数 的 线程 ) 执行 。 


如 采 不 布 望 当 前 线程 执行 ， 避 免 可 能 的 同步 阻塞 ， 可 以 使 用 其 他 两 
个 异步 注册 方法 : 





public CompletableFuture<T> whenCompleteAsync( 
BiConsumer<? super T, ? super Throwable> action) 
public CompletableFuture<T> whenCompleteAsync( 
BiConsumer<? super T, ? super Throwable> action, Executor executor) 





与 前 面 介绍 的 以 Async 结 尾 的 方法 一 样 ， 对 第 一 个 方法 ， 注 册 函 数 


action 会 由 默认 的 任务 执行 服务 〈 即 ForkJoinPool.commonPool () 或 
ThreadPerTaskExecutor) 执行 ， 对 第 二 个 方法 ， 会 由 参数 中 指定 的 
executor 执 行 。 





2.handle 


whenComplete 只 是 注册 回调 函数 ， 不 改变 结果 ， 它 返回 了 一 个 
CompletableFuture， 但 这 个 CompletableFuture 的 结果 与 调用 它 的 
CompletableFuture 是 一 样 的， 还 有 一 个 类 似 的 注册 方法 handle， 其 声明 
为 : 





public <U> CompletableFuture<U> handlel( 
BiFunction<? super T, Throwable, ? extends U> fn) 





回调 函数 是 一 个 BiFunction， 也 是 接受 两 个 参数 ， 一 个 是 正常 结 
果 ， 男 一 个 是 异常 ， 但 BiFunction 有 返回 值 ， 在 handle 返 回 的 
CompletableFuture 中 ， 结 末 会 被 BiFunction 的 返回 值 蔡 代 ， 即 使 原来 有 





String ret = 
CompletableFuture.supplyAsync(()->{ 
throw new RuntimeException("test"); 
}).handle((result, ex)->{ 
return "hello"; 
}).join(); 
System,out.println(ret)， 





输出 为 "hello"。 异 步 任 务 抛 出 了 寞 常 ， 但 通过 handle 方 法 ， 改 变 了 
结果 。 


与 whenComplete 类 似 ，handle 也 有 对 应 的 异步 注册 方法 
handleAsync， 具 体 我 们 就 不 探讨 了 。 


3.exceptionally 








whenComplete 和 handle 都 是 既 啊 应 正常 完成 也 响应 异常 ， 如 果 只 对 
异常 感 兴趣 ， 可 以 使 用 exceptionally， 其 声明 为 : 





public CompletableFuture<T> exceptionally( 


Function<Throwable, ? extends T> fn) 








它 注册 的 回调 函数 是 Function， 接 受 的 参数 为 异常 ， 返 回 一 个 值 ， 
与 handle 类 似 ， 它 也 会 改变 结果 ， 具 体 束 不 举例 了 。 


除了 响应 结果 和 异常 ， 使 用 CompletableFuture， 可 以 方便 地 构建 有 
多 种 依赖 关系 的 任务 流 ， 我 们 驳 来 看 简单 的 依赖 单一 阶段 的 情况 。 


26.4.4 构建 依赖 单一 阶段 的 任务 流 


我 们 来 看 儿 个 相关 的 方法 


thenCompose。 





thenRun、thenAccept/thenApply 和 


1.thenRun 


在 一 个 阶段 正常 完成 后 ， 执 行 下 一 个 任务 ， 看 个 简单 示例 : 





Runnable taskA = () -> System.out.println("task A"); 
Runnable taskB = () -> System.out.println("task B"); 
Runnable taskC = () -> System.out.println("task C"); 
CompletableFuture.runAsync(taskA).thenRun(taskB).thenRun(taskCcC).join(); 





这 里 ， 有 三 个 异步 任务 taskA、taskB 和 taskC， 通 过 thenRun 自 然 地 
描述 了 它们 的 依赖 关系 。thenRun 是 同步 版 本 ， 有 对 应 的 异步 版 本 
thenRunAsync: 





public CompletableFuture<Void> thenRunAsync(Runnable action) 
public CompletableFuture<Void> thenRunAsync(Runnable action, 
Executor executor) 





在 thenRun 构 建 的 任务 流 中 ， 只 有 前 一 个 阶段 没 腊 常 结束 ， 下 一 
个 阶段 的 任务 才 会 执行 ， 如 果 前 一 个 阶段 发 生 了 异常 ， 所 有 后 续 阶 段 都 
不 会 运行 ， 结 果 会 被 设 为 相同 的 异常 ， 调 用 join 会 抛 出 运行 时 异 帝 
CompletionEXception 。 


thenRun 指 定 的 下 一 个 任务 类 型 是 Runnable， 它 不 需要 前 一 个 阶段 
的 结果 作为 参数 ， 也 没有 返回 值 ， 所 以 ， 在 thenRun 返 回 的 


CompletableFuture 中 ， 结 果 类 型 为 Void， 即 没有 结 
2.thenAccept/thenApply 


如 果 下 一 个 任务 需要 前 一 个 阶段 的 结果 作为 参数 ， 可 以 使 用 
thenAccept 或 thenApply 方 法 : 





public CompletableFuture<Void> thenAccept( 
Consumer<? super T> action) 

public <U> CompletableFuture<U> thenApply( 
Function<? super T,? extends U> fn) 





thenAccept 的 任务 类 型 是 Consumer， 它 接受 前 一 个 阶段 的 结果 作为 
参数 ， 没 有 返回 值 。thenApply 的 任务 类 型 是 Function， 接 受 前 一 个 阶段 
的 结果 作为 参数 ， 返 回 一 个 新 的 值 ， 这 个 值 会 成 为 henApply 返 回 的 
CompletableFuture 的 结果 值 。 看 个 简单 示例 : 





Supplier<String> taskA = () -> "hello"; 

Function<String, String> taskB = (t) -> t.toUpperCase(); 

Consumer<String> taskC = (t) -> System.out.println("consume: " + t); 

CompletableFuture. supplyAsync (taskA) 
‘thenApply(taskB).thenAccept(taskCcC).join(); 





task 人 A 的 结果 是 "hello"， 传 递 给 了 taskB，taskB 转 换 结 
为 "HELLO"， 再 把 结果 给 taskC，taskC 进 行 了 输出 ， 所 以 输出 为 : 





consume: HELLO 





CompletableFuture 中 有 很 多 名 称 带 有 run、accept 或 apply 的 方法 ， 它 
们 一 般 与 任务 的 类 型 相对 应 ，run 与 Runnable 对 应 ，accept 与 Consumer 对 
应 ，apply 与 Function 对 应 ， 后 续 就 不 闹 述 了 。 


3.thenCompose 


与 thenApply 类 似 ， 还 有 一 个 方法 thenCompose， 声 明 为 : 





public <U> CompletableFuture<U> thenCompose( 
Function<? super T, ? extends CompletionSstage<U>> fn) 





这 个 任务 类 型 也 是 Function， 也 是 接受 前 一 个 阶段 的 结果 ， 返 回 一 
个 新 的 结果 。 不 过 ， 这 个 转换 函数 fn 的 返回 值 类 型 是 CompletionStage， 
也 就 是 说 ， 它 的 返回 值 也 是 一 个 阶段 ， 如 果 使 用 thenApply， 结 果 就 会 
变 为 CompletableFuture<CompletableFuture<U>>， 而 使 用 thenCompose， 
会 直接 返回 名 返回 的 CompletionStage。thenCompose 与 thenApply 的 区 别 
就 如 同 Stream API 中 flatMap 与 map 的 区 别 ， 看 个 简单 的 示例 : 





Supplier<String> taskA = () -> "hello"; 
Function<String, CompletableFuture<String>> taskB = (t) -> 
CompletableFuture.supplyAsync(() -> t.toUpperCase()); 
Consumer<String> taskC = (t) -> System.out.printjn("consume: " + t); 
CompletableFuture. supplyAsync (taskA) 
.thenCcompose(taskB).thenAccept(taskcC).join(); 





以 上 代码 中 ，taskB 是 一 个 转换 函数 ， 但 它 自 己 也 执行 了 异步 任 
务 ， 返 回 类 型 也 是 CompletableFuture， 所 以 使 用 了 thenCompose。 


26.4.5 构建 依赖 两 个 阶段 的 任务 流 


thenRun、thenAccept、thenApply 和 thenCompose 用 于 在 一 个 阶段 完 
成 后 执行 男 一 个 任务 ，CompletableFuture 还 有 一 些 方法 用 于 在 两 个 阶段 
都 完成 后 执行 另 一 个 任务 ， 方 法 是 : 





public CompletableFuture<Void> runAfterBoth( 
CompletionSstage<?> other, Runnable action 

public <U,V> CompletableFuture<V> thenCombine( 
CompletionSstage<? extends U> other, 
BiFunction<? super T,? super U,? extends V> fn) 

public <U> CompletableFuture<Void> thenAcceptBoth( 
CompletionSstage<? extends U> other, 
BiConsumer<? super T, ? super U> action) 





runAfterBoth 对 应 的 任务 类 型 是 Runnable，thenCombine 对 应 的 任务 
类 型 是 BiFunction， 接 受 前 两 个 阶段 的 结果 作为 参数 ， 返 回 一 个 结果 ; 
thenAcceptBoth 对 应 的 任务 类 型 是 BiConsumer， 接 受 前 两 个 阶段 的 结果 
作为 参数 ， 但 不 返回 结果 。 它 们 都 有 对 应 的 异步 和 带 Executor 参 数 的 版 
本 ， 用 于 指定 下 一 个 任务 由 谁 执行 ， 具 体 束 不 著述 了 。 当 前 阶段 和 参数 
指定 的 男 一 个 阶段 other 没 有 依赖 关系 ， 并 发 执行 ， 当 两 个 都 执行 结 
后 ， 开 始 执 行 指定 的 男 一 个 任务 。 





IE 





Supplier<String> taskA = () -> "taskA"; 
CompletableFuture<String> taskB = CompletableFuture.supplyAsync( 
() -> "taskB"); 
BiFunction<String, String, String> taskC = (a, b) ->a+"," +b; 
String ret = CompletableFuture.supplyAsync(taskA) 
.thenCcombineAsync(taskB, taskC).join(); 
System.out.println(ret); 





输出 为 : 





taskA, taskB 





前 面 的 方法 要 求 两 个 阶段 都 完成 后 才 执 行 下 一 个 任务 ， 如 果 只 需要 
其 中 任意 一 个 阶段 完成 ， 可 以 使 用 下 面 的 方法 : 





public CompletableFuture<Void> runAfterEither( 

Completionstage<?> other, Runnable action) 
public <U> CompletableFuture<U> applyToEither( 

CompletionStage<? extends T> other, Function<? Super T, U> fn) 
public CompletableFuture<Void> acceptEither( 

CompletionStage<? extends T> other, Consumer<? Super T> action) 





它们 都 有 对 应 的 异步 和 带 Executor 参 数 的 版 本 ， 用 于 指定 下 一 个 任 
务 由 谁 执 行 ， 具 体 束 不 次 述 了 。 当 前 阶段 和 参数 指定 的 力 一 个 阶段 other 
没有 依赖 关系 ， 并 发 执行 ， 只 要 其 中 一 个 执行 完了 ， 束 会 局 动 参数 指定 
的 另 一 个 任务 ， 有 具体 就 不 痪 述 了 。 





26.4.6 ”构建 依赖 多 个 阶段 的 任务 流 


如 果 依 赖 的 阶段 不 止 两 个 ， 可 以 使 用 如 下 方法 : 





public static CompletableFuture<Void> allof(CompletableFuture<?>... cfs) 
public static CompletableFuture<Object> anyof (CompletableFuture<?>... cfs) 








它们 是 静态 方法 ， 基 于 多 个 CompletableFuture 构 建 了 一 个 新 的 


CompletableFuture。 


对 于 allOf， 当 所 有 子 CompletableFuture 都 完成 时 ， 它 才 完 成 ， 如 果 
有 的 Completable-Future 异 常 结束 了 ， 则 新 的 CompletableFuture 的 结果 也 
是 异常 。 不 过 ， 它 并 不 会 因为 有 和 异常 束 提 前 结束 ， 而 是 会 等 待 所 有 阶段 
结束 ， 如 果 有 多 个 阶段 民利 结束 ， 新 的 Com-pletableFuture 中 保存 的 卉 第 
是 最 后 一 个 的 。 新 的 CompletableFuture 会 持 有 异常 结果 ， 但 不 会 保存 正 
党 结束 的 结果 ， 如 果 需 要 ， 可 以 从 每 个 阶段 中 获取 。 看 个 简单 的 示例 : 

















CompletableFuture<String> taskA = CompletableFuture.supplyAsync(() -> { 
delayRandom(100, 1000); 
return "helloA"; 

}, executor); 

CompletableFuture<Void> taskB = CompletableFuture.runAsync(() -> { 
delayRandom(2000, 3000); 

}, executor); 

CompletableFuture<Void> taskC = CompletableFuture.runAsync(() -> { 
delayRandom(30, 100); 
throw new RuntimeException("task C exception"); 

}, executor); 

CompletableFuture.allof(taskA, taskB, taskC).whenCcomplete((result, ex) -> { 
if(ex != null) { 

System.out.println(ex.getMessage( )); 


} 

if(!taskA.isCompletedExceptionally()) { 
System.out.printin("task A " + taskA.join()); 

} 


}); 





taskC 会 首先 异常 结束 ， 但 新 构建 的 CompletableFuture 会 等 待 其 他 两 
个 阶段 结束 ， 都 结束 后 ， 可 以 通过 子 阶段 〈 如 taskA) 的 方法 检查 子 阶 
段 的 状态 和 结果 。 


对 于 anyOf 返 回 的 CompletableFuture， 当 第 一 个 子 CompletableFuture 
完成 或 异常 结束 时 ， 它 相应 地 完成 或 异常 结束 ， 结 果 与 第 一 个 结束 的 子 
CompletableFuture 一 样 ， 具 体 就 不 举例 了 。 








26.4.7 小结 


本 节 介 绍 了 Java 8 中 的 组 合式 异步 编程 CompletableFuture: 


1) 它 是 对 Future 的 增强 ， 但 可 以 啊 应 结果 或 异常 事件 ， 有 很 多 方法 
构建 异步 任务 流 。 








2) 根据 任务 由 谁 执行 ， 一 般 有 三 类 对 应 方法 : 名 称 不 带 Async 的 方 
法 由 当前 线程 或 前 一 个 阶段 的 线程 执行 ， 带 Async 但 没有 指定 Executor 的 
方法 由 默认 Excecutor (Fork-JoinPool.commonPool () 或 
ThreadPerTaskExecutor) 执行 ， 带 Async 且 指定 Executor 人 参数 的 方法 由 指 
定 的 Executor 执 行 。 


3) 根据 任务 类 型 一般 也 有 三 类 对 应 方法 : 名 称 带 run 的 对 应 
Runnable， 带 accept 的 对 应 Consumer， 带 apply 的 对 应 Function。 


使 用 CompletableFuture， 可 以 简洁 自然 地 表达 多 个 异步 任务 之 则 的 
依赖 关系 和 执行 流程 ， 大 大 简化 代码 ， 提 高 可 读 性 。 





26.5 ” Java 8 的 日 期 和 时 间 API 


本 节 介 绍 Java 8 对 日 期 和 时 间 API 的 增强 。 我 们 在 之 前 介绍 了 Java 8 
以 前 的 日 期 和 时 间 API， 主 要 的 类 是 Date 和 Calendar， 由 于 它 的 设计 有 一 
些 不 足 ，Java 8 引入 了 一 套 新 的 API， 位 于 包 java.time 下 。 本 节 我 们 就 来 
简要 介绍 这 套 新 的 API， 先 从 日 期 和 时 间 的 表示 开始 。 


26.5.1 表示 日 期 和 时 间 


我 们 在 第 7 章 介 绍 过 日 期 和 时 间 的 几 个 基本 概念 ， 包 括 时 刻 、 时 区 
和 年 历 ， 这 里 就 不 痪 述 了 。Java 8 中 表示 日 期 和 时 间 的 类 有 多 个 ， 主 要 
的 有 : 

Instant: 表示 时 刻 ， 不 直接 对 应 年 月 日 信息 ， 需 要 通过 时 区 转换 ; 


-LocalDateTime: 表示 与 时 区 无 关 的 日 期 和 时 间 ， 不 直接 对 应 时 
刻 ， 需 要 通过 时 区 转换 ，; 


:Zoneld/ZoneOffset: 表示 时 区 ; 


:LocalDate: 表示 与 时 区 无 天 的 日 期 ， 与 LocalDateTime 相 比 ， 只 有 
日 期 ?9 没有 时 间 信 屿 ， 


:LocalTime: 表示 与 时 区 无 关 的 时 间 ， 与 LocalDateTime 相 比 ， 只 有 
时 间 ? 没有 日 期 信 屿 ， 


:ZonedDateTime: 表示 特定 时 区 的 日 期 和 时 间 。 


类 比较 多 ， 但 概念 更 为 清晰 了， 下面 我 们 逐个 介绍 。 














1.Instant 


Instant 表 示 时 刻 ， 获 取 当 前 时 刻 ， 代 码 为 : 





Instant now = Instant.now(); 





可 以 根据 Epoch Time 〈 纪 元 时 ) 创建 Instant。 比 如 ， 另 一 种 获取 当 
前 时 刻 的 代码 可 以 为 : 





Instant now = Instant.ofEpochMilli(System.currentTimeMillis()); 





我 们 知道 ，Date 也 表示 时 刻 ，Instant 和 Date 可 以 通过 纪元 时 相互 转 
换 ， 比 如 ， 转 换 Date 为 Instant， 代 码 为 : 





public static Instant toInstant(Date date) { 
return Instant.ofEpochMilli(date.getTime()); 
} 





转换 Instant 为 Date， 代 码 为 : 





public static Date toDate(Instant instant) { 
return new Date(instant.toEpochMil1i()); 





Instant 有 很 多 基于 时 刻 的 比较 和 计算 方法 ， 大 多 比较 直观 ， 我 们 惑 
不 列举 了 。 


2.LocalDateTime 


LocalDateTime 表 示 与 时 区 无 关 的 日 期 和 时 间 ， 获 取 系 统 默 认 时 区 
的 当前 日 期 和 时 间 ， 代 码 为 : 





LocalDateTime ldt = LocalDateTime.now(); 





还 可 以 直接 用 年 月 日 等 信息 构建 LocalDateTime。 比 如 ， 表 示 2017 
年 7 月 11 日 20 点 45 分 5 秒 ， 代 码 可 以 为 : 





LocalDateTime ldt = LocalDateTime.of(2017, 7, 11, 20, 45, 5); 





LocalDateTime 有 很 多 方法 ， 可 以 获取 年 月 日 时 分 秒 等 日 历 信 息 ， 
比如 : 


有 


public int getYear() 
public int getMonthVvalue() 
public int getDayofMonth() 
public int getHour() 
public int getMinute() 
public int getSecond() 








public DayOfweek getDayofweek() 





DayOfWeek 是 一 个 枚 举 ， 有 7 个 取 值 ， 从 DayOfWeek.MONDAY 到 
DayOfweek.SUN-DAY 。 


3.Zoneld/ZoneOffset 
LocalDateTime 不 能 直接 转 为 时 刻 Instant， 转 换 需 要 一 个 参数 


ZoneOffset，ZoneOffset 表 示 相 对 于 格林 尼 治 的 时 区 差 ， 北 京 是 +08: 
00。 比 如 ， 转 换 一 个 LocalDateTime 为 北京 的 时 刻 ， 方 法 为 : 








public static Instant toBeijingInstant(LocalDateTime ldt) { 
return ldt.toInstant(ZoneOffset.of("+08:00")); 
} 





给 定 一 个 时 刻 ， 使 用 不 同时 区 解读 ， 日 历 信息 是 不 同 的 ，Instant 有 
方法 根据 时 区 返回 一 个 ZonedDateTime: 











public ZonedDateTime atZzone(ZoneId zone) 





默认 时 区 是 ZoneId.systemDefault () ， 可 以 这 样 构建 ZoneId: 





// 北 京 时 区 
ZoneId bjZone = ZoneId.of("GMT+08:00") 











ZoneOffset 是 Zoneld 的 子 类 ， 可 以 根据 时 区 天 构造 。 


4.LocalDate/LocalTime 


可 以 认为 LocalDateTime 由 两 部 分 组 成 ， 一 部 分 是 日 期 LocalDate， 
另 一 部 分 是 时 间 LocalTime。 它 们 的 用 法 也 很 直观 ， 比 如 : 





// 表 示 2017 年 7 月 11 日 
LocalDate 1d = LocalDate.of(2017, 7, 11); 

// 当 前 时 刻 按 系 统 默认 时 区 解读 的 日 其 

LocalDate now = LocalDate.now!(); 

// 表 示 214 所 19 分 34 秒 

LocalTime lt = LocalTime.of(21, 10, 34); 

// 当 前 时 刻 按 系统 默认 时 区 解读 的 时 间 

LocalTime time = LocalTime.now(); 
LocalDateTime 由 LocalDate 和 LocalTime 构 成 ，LocalDate 加 上 时 间 可 以 构成 



































LocalDateTime 由 LocalDate 和 LocalTime 构 成 ，LocalDate 加 上 时 间 可 
以 构成 LocalDate-Time，LocalTime 加 上 日 期 可 以 构成 LocalDateTime， 
比如 : 





LocalDateTime ldt = LocalDateTime.of(2017, 7, 11, 20, 45, 5); 
LocalDate 1d = ldt.toLocalDate(); //2017-07-11 

LocalTime lt = ldt.toLocalTime(); // 20:45:05 
//LocalDate 加 上 时 间 ， 结 果 为 2017-07-11 21:18:39 

LocalDateTime ldt2 = ld.atTime(21, 18, 39); 

//LocalTime 加 上 日 期 ,结果 为 2016-063-24 20:45:05 

LocalDateTime ldt3 = lt.atDate(LocalDate.of(2016, 3, 24)); 























5.ZonedDateTime 


ZonedDateTime 表 示 特 定时 区 的 日 期 和 时 间 ， 获 取 系 统 默认 时 区 的 
当前 日 期 和 时 间 ， 代 码 为 : 





ZonedDateTime zdt = ZonedDateTime,now() ， 





LocalDateTime.now 〈) 也 是 获取 默认 时 区 的 当前 日 期 和 时间 ， 有 
什么 区 别 呢 ? Local-DateTime 内 部 不 会 记录 时 区 信息 ， 只 会 单纯 记录 年 
月 日 时 分 秒 等 信息 ， 而 ZonedDateTime 除 了 记录 日 历 信 息 ， 还 会 记录 时 
区 ， 它 的 其 他 大 部 分 构建 方法 都 需要 显 式 传递 时 区 ， 比 如 : 

















// 根 据 Instant 和 时 区 构建 zonedDateTime 

public static ZonedDateTime ofInstant(Instant instant, ZoneId zone) 

// 根 据 LocalDate、LocalTime 和 ZoneId 构 造 

public static ZonedDateTime of(LocalDate date, LocalTime time, ZoneId zone) 
ZonedDateTime 可 以 直接 转换 为 Instant， 比 如 : 


























ZonedDateTime ldt = ZonedDateTime,now() ， 
Instant now = ldt.toInstant(); 





26.5.2 ”格式 化 


Java 8 中 ， 主 要 的 格式 化 类 是 java.time.format.DateTimeFormatter， 
它 是 线程 安全 的 ， 看 个 例子 : 





DateTimeFormatter formatter = DateTimeFormatter ,ofPattern( 
"yyyy-MM-dd HH:mm:ss"); 

LocalDateTime ldt = LocalDateTime.of(2016,8,18,14,20,45); 

System.out.println(formatter.format(1dt)); 





输出 为 : 





2016-08-18 14:20:45 





, 将 字符 串 转 化 为 日 期 和 时 间 对 象 ， 可 以 使 用 对 应 类 的 parse 方 法 ， 比 
0D: 





DateTimeFormatter formatter = DateTimeFormatter ,ofPattern( 
"yyyy-MM-dd HH:mm:ss"); 

String Str = "2016-08-18 14:20:45"，; 

LocalDateTime ldt = LocalDateTime.parse(str, formatter); 





26.5.3 ”设置 和 修改 时 间 


修改 时 期 和 时 间 有 两 种 方式 ， 一 种 是 直接 设置 绝对 值 ， 为 一 种 是 在 
现 有 值 的 基础 上 进行 相对 增 减 操作 ，Java 8 的 大 部 分 类 都 文 持 这 两 种 方 
式 。 忆 外 ，Java 8 的 大 部 分 类 都 是 不 可 变 类 ， 修 改 操作 是 通过 创建 并 返 
回 新 对 象 来 实现 的 ， 原 对 象 本 身 不 会 变 。 我们 来 看 一 些 例子 。 


调整 时 间 为 下 午 3 点 20 分 ， 代 码 为 : 





LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.withHour(15).withMinute(20).withSecond(0).withNano(0); 





还 可 以 为 : 





LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.toLocalDate().atTime(15, 20); 





3 小 时 5 分 钟 后 ， 示 例 代 码 为 : 





LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.plusHours(3).plusMinutes(5); 





LocalDateTime 有 很 多 plusXXX 和 minusXXX 方 法 ， 分 别 用 于 相对 增 
加 和 减少 时 间 。 


今天 0 点 ， 可 以 为 : 





LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.with(ChronoField.MILLI OF_DAY, 0); 








ChronoField 是 一 个 枚 举 ， 里 面 定 义 了 很 多 表示 日 历 的 字段 ， 
MILLI OF _ DAY 表示 在 一 天 中 的 旦 秒 数 ， 值 从 0 到 
(24*60*60*1000) -1。 还 可 以 为 : 








LocalDateTime ldt = LocalDateTime.of(LocalDate.now(), LocalTime.MIN); 





LocalTime.MIN 表 示 "00: 00"。 也 可 以 为 : 





LocalDateTime ldt = LocalDate.now().atTime(0, 0); 





下 周二 上 午 10 点 整 ， 可 以 为 ; 





LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.plusweeks(1).with(ChronoField.DAY_ OF WEEK, 2) 
.With(ChronoField.MILLI_ OF_DAY, 0).withHour(10); 








上 面 下 周二 指定 是 下 周 ， 如 果 是 下 一 个 周二 呢 ? 这 与 当前 是 周 儿 有 
关 ， 如 果 当 前 是 周一 ， 则 下 一 个 周二 就 是 明天 ， 而 其 他 情况 则 是 下 周 ， 
代码 可 以 为 : 





LocalDate 1d = LocalDate.now(); 
if(!1d.getDayofweek(),equals(DayOfweek .MONDAY)){ 
ld = ld.plusweeks(1); 


} 
LocalDateTime ldt = ld.with(ChronoField.DAY_ OF_ WEEK, 2).atTime(10, 0); 





针对 这 种 复杂 一 点 的 调整 ，Java 8 有 一 个 专门 的 接口 
TemporalAdjuster， 这 是 一 个 函数 式 接口 ， 定 义 为 : 





public interface TemporalAdjuster { 
Temporal adjustInto(Temporal temporal); 








Temporal 是 一 个 接口 ， 表 示 日 期 或 时 间 对 象 ，Instant、 
LocalDateTime 和 LocalDate 等 都 实现 了 它 ， 这 个 接口 就 是 对 日 期 或 时 间 
进行 调整 ， 还 有 一 个 专门 的 类 TemporalAdjusters， 里 面 提供 了 很 多 
TemporalAdjuster 的 实现 。 比 如 ， 针 对 下 一 个 周 几 的 调整 ， 方 法 是 : 





public static TemporalAdjuster next(Dayofweek dayofWweek) 





针对 上 面 的 例子 ， 代 码 可 以 为 : 





LocalDate 1d = LocalDate.now(); 
LocalDateTime ldt = ld.with(TemporalAdjusters.next( 
DayOfweek .TUESDAY)).atTime(10, 0); 








这 个 next 方 法 是 怎么 实现 的 呢 ? 看 代码 : 





public static TemporalAdjuster next(DayOfweek dayOofweek) { 
int dowValue = dayofWeek.getValue(); 
return (temporal) -> { 
int calDow = temporal.get(DAY_OF_ WEEK); 
int daysDiff = calDow - dowValue; 
return temporal.plus(daysDiff >= © ? 7 - daysDiff : -daysDiff, DAYS); 
}; 





它 内 部 封装 了 一 些 条 件 判 断 和 具体 调整 ， 提 供 了 更 为 易 用 的 接口 。 
TemporalAdjusters 中 还 有 很 多 方法 ， 部 分 方法 如 下 : 





public static TemporalAdjuster firstDayofMonth() 

public static TemporalAdjuster lastDayofMonth() 

public static TemporalAdjuster firstInMonth(Dayofweek dayofweek) 
public static TemporalAdjuster lastInMonth(DayOofweek dayofweek ) 
public static TemporalAdjuster previous(DayOofwWeek dayOfweek ) 
public static TemporalAdjuster nextOrSame(DayOfWweek dayofWeek) 





这 些 方法 的 含义 比较 直观 ， 就 不 解释 了 。 它 们 主要 是 封 浪 了 日 期 和 
时 间 调 整 的 一 些 基本 操作 ， 更 为 易 用 。 


明天 最 后 一 刻 ， 代 码 可 以 为 : 





LocalDateTime ldt = LocalDateTime.of( 
LocalDate .now().plusDays(1), LocalTime.MAX); 





或 者 为 : 





LocalDateTime ldt = LocalTime.MAX.atDate(LocalDate.now().plusDays(1)); 











本 月 最 后 一 天 最 后 一 刻 ， 代 码 可 以 为 : 





LocalDateTime ldt = LocalDate,now() 
.with(TemporalAdjusters.1lastDayofMonth()).atTime(LocalTime .MAX); 





lastDayOfMonth 〈) 是 怎么 实现 的 呢 ? 看 代码 : 





public static TemporalAdjuster lastDayofMonth() { 
return(temporal) -> temporal.with(DAY_OF_MONTH, 
temporal.range(DAY_OF_MONTH) .getMaximum( )); 








这 里 使 用 了 range 方 法 ， 从 它 的 返回 值 可 以 获取 对 应 日 历 单位 的 最 
大 最 小 值 ， 展 开 ， 本 月 最 后 一 天 最 后 一 刻 的 代码 还 可 以 为 : 














long maxDayOfMonth = LocalDate.now().range( 
ChronoField.DAY_OF_MONTH) .getMaximum( ) ， 
LocalDateTime ldt = LocalDate,now() 
.WithDayOofMonth( (int)maxDayOofMonth).atTime(LocalTime .MAX); 





下 个 月 第 一 个 周一 的 下 午 5 扩 整 ， 代 码 可 以 为 : 





LocalDateTime ldt = LocalDate.now().plusMonths(1) 
.With(TemporalAdjusters.firstIinMonth(DayOofWeek.MONDAY)).atTime(17, 0); 





26.5.4 时 间 段 的 计算 


Java 8 中 表示 时 间 段 的 类 主要 有 两 个 :Period 和 Duration。Period 表 
示 日 期 之 间 的 差 ， 用 年 月 日 表示 ， 不 能 表示 时 间 ; Duration 表示 时 间 
差 ， 用 时 分 秒 等 表示 ， 也 可 以 用 天 表示 ， 一 天 严格 等 于 24 小 时 ， 不 能 
年 月 表示 。 下 面 看 一 些 例子 。 


计算 两 个 日 期 之 间 的 差 ， 看 个 Period 的 例子 : 














LocalDate 1d1i = LocalDate.of(2016, 3, 24); 
LocalDate 1d2 = LocalDate.of(2017, 7, 12); 
Period period = Period,between(1d1，1d2) ; 
System.out.println(period.getYears() + "年 " 
+ period.getMonths() + "月 " + period.getDays() + "天 ")， 




















输出 为 : 





| 
p 


年 3 月 18 天 








根据 生日 计算 年 龄 ， 示 例 代 码 可 以 为 : 





LocalDate born = LocalDate.of(1990,06,20); 
int year = Period.between(born, LocalDate.now()).getYears(); 





计算 述 到 分 钟 数 ， 假 定 早上 9 点 是 上 班 时 间 ， 过 了 9 反 算 述 到 ， 人 述 到 


要 统计 迟到 的 分 钟 数 ， 怎 么 计算 呢 ? 看 代码 : 





long lateMinutes = Duration.between(LocalTime.of(9,0), 
LocalTime.now()).toMinutes(); 





26.5.5 ”与 Date/Calendar 对 象 的 转换 


Java 8 的 日 斯 和 时 间 API 没 有 提供 与 老 的 Date/Calendar 相 互 转换 的 方 
法 ， 但 在 实际 中 ， 我 们 可 能 是 需要 的 。 前 面 介 绍 了 Date 可 以 与 Instant 通 
过 宇 秒 数 相互 转换 ， 对 于 其 他 类 型 ， 也 可 以 通过 室 秒 数 /mmstant 相 互 转 
换 。 比 如 ， 将 LocalDateTime 按 默认 时 区 转换 为 Date， 代 码 可 以 为 : 





public static Date toDate(LocalDateTime 1]dt){ 
return new Date(ldt.atZone(ZoneId.systemDefault()) 
.toInstant().toEpochMil1i()); 





将 ZonedDateTime 转 换 为 Calendar， 代 码 可 以 为 : 





public static Calendar toCalendar(ZonedDateTime zdt) { 
TimeZone tz = TimeZone.getTimeZone(zdt.getZzone()); 
Calendar calendar = Calendar.getInstance(tz ) ; 
calendar.setTimeInNMillis(zdt.toInstant().toEpochMill1i()); 
return calendar; 





Calendar 保 持 了 ZonedDateTime 的 时 区 信息 。 


将 Date 按 默认 时 区 转换 为 LocalDateTime， 代 码 可 以 为 : 





public static LocalDateTime toLocalDateTime(Date date) { 
return LocalDateTime.ofInstant(Instant.ofEpochMilli(date.getTime()), 
ZoneId.systemDefault()); 





将 Calendar 转 换 为 ZonedDateTime， 代 人 码 可 以 为 : 





public static ZonedDateTime toZonedDateTime(Calendar calendar) { 


ZonedDateTime zdt = ZonedDateTime.ofInstant( 
Instant.ofEpochMilli(calendar .getTimeInMillis()), 
calendar ,getTimeZzone(),toZoneId( )); 

return zdt; 





至 此 ， 关 于 Java 8 的 日 期 和 时 间 API 就 介绍 完了 。 相 比 以 前 版 本 的 
人 它 引 入 了 更 多 的 类 ， 但 概念 更 为 清晰 ， 更 为 强大 和 易 


本 章 介 绍 了 Java 8 引入 的 Lambda 表 达 式 、 函 数 式 编程 ， 以 及 日 期 和 
时 间 API， 利 用 本 章 介 绍 的 内 容 ， 我 们 可 以 在 更 高 的 抽象 层次 上 思考 和 
解决 问题 ， 包 插 处 理 集合 数据 、 管 理 异步 任务 、 操 作 日 期 和 时 间 等 。 


